mannix/llama3-sppo-iter3:q8_0/params

mannix/ llama3-sppo-iter3:q8_0

265 Downloads Updated 2 years ago

Meta Llama-3-8b with Self-Play Preference Optimization for Language Model Alignment at iteration 3

llama3-sppo-iter3:q8_0 ... /

params

577073ffcc6c · 110B

{

"num_keep": 24,

"stop": [

"<|start_header_id|>",

"<|end_header_id|>",

"<|eot_id|>"

]

}