335 10 months ago

[GGUF/Q6_K] Finetune версия Qwen3, адаптированная для генерации русского текста.

tools
ollama run OxW/Qwen3-8b-ru-i1

Applications

Claude Code
Claude Code ollama launch claude --model OxW/Qwen3-8b-ru-i1
Codex
Codex ollama launch codex --model OxW/Qwen3-8b-ru-i1
OpenCode
OpenCode ollama launch opencode --model OxW/Qwen3-8b-ru-i1
OpenClaw
OpenClaw ollama launch openclaw --model OxW/Qwen3-8b-ru-i1

Models

View all →

Readme

Source: HF

Qwen3-8B-ru

  • [EN]
    Qwen3-based model, adapted for russian text generation tasks.
  • [RU]
    Finetune версия Qwen3, адаптированная для генерации русского текста.

Model Details / Детализация модели

  • [EN]
    LoRA supervised finetuning was performed on 2xA100 NVIDIA GPUs for 12h for 1 epoch on datasets:
    attn-signs/kolmogorov-3;
    attn-signs/russian-code;

  • [RU]
    LoRA SFT цикл был выполнен на двух NVIDIA A100, обучение длилось около 12 часов.
    Прогон полной эпохи датасетов:
    attn-signs/kolmogorov-3;
    attn-signs/russian-code;