86 Downloads Updated 4 months ago
Updated 4 months ago
4 months ago
d6691ef74d5a · 6.7GB ·
Source: HF
[EN]
LoRA supervised finetuning was performed on 2xA100 NVIDIA GPUs for 12h for 1 epoch on datasets:
attn-signs/kolmogorov-3;
attn-signs/russian-code;
[RU]
LoRA SFT цикл был выполнен на двух NVIDIA A100, обучение длилось около 12 часов.
Прогон полной эпохи датасетов:
attn-signs/kolmogorov-3;
attn-signs/russian-code;