321 6 months ago

LoRA-адаптер для модели YandexGPT-5-Lite-8B-pretrain обученный на миксе из датасетов реализующих r1 (ризонинг) подход.

8b
d8ba2f9a17b3 · 18B
{
"temperature": 1
}