mannix/llama3-sppo-iter3/params

mannix/

llama3-sppo-iter3:latest

238 Downloads Updated 1 year ago

Meta Llama-3-8b with Self-Play Preference Optimization for Language Model Alignment at iteration 3

llama3-sppo-iter3:latest ... /

params

577073ffcc6c · 110B

{

"num_keep": 24,

"stop": [

"<|start_header_id|>",

"<|end_header_id|>",

"<|eot_id|>"

]

}