86 4 months ago

[GGUF/Q6_K] Finetune версия Qwen3, адаптированная для генерации русского текста.

tools

Models

View all →

Readme

Source: HF

Qwen3-8B-ru

  • [EN]
    Qwen3-based model, adapted for russian text generation tasks.
  • [RU]
    Finetune версия Qwen3, адаптированная для генерации русского текста.

Model Details / Детализация модели

  • [EN]
    LoRA supervised finetuning was performed on 2xA100 NVIDIA GPUs for 12h for 1 epoch on datasets:
    attn-signs/kolmogorov-3;
    attn-signs/russian-code;

  • [RU]
    LoRA SFT цикл был выполнен на двух NVIDIA A100, обучение длилось около 12 часов.
    Прогон полной эпохи датасетов:
    attn-signs/kolmogorov-3;
    attn-signs/russian-code;