2,956 Downloads Updated 4 months ago
Updated 4 months ago
4 months ago
9e3e817af4d3 · 16GB ·
RefinedNeuro/RN_TR_R2 is a Turkish‐language reasoning model fine-tuned from
ytu-ce-cosmos/Turkish-Llama-8b-DPO-v0.1
using the GRPO method on distilled Q&A data of Qwen3 model. It excels at open-ended reasoning tasks in Turkish, particularly STEM, history, and cultural questions.
Benchmark: RN_TR_R2_Benchmark_Results (Open-ended Turkish culture & reasoning questions)
Model Name | Score (%) | Description |
---|---|---|
RefinedNeuro/RN_TR_R2 | 82.4 | Upgraded from RN_TR_R1 via GRPO on distilled Qwen3 data |
Qwen3-8B | 76.8 | Off-the-shelf Qwen3-8B |
RefinedNeuro/RN_TR_R1 | 64.8 | Baseline Turkish-fine-tuned model |
ytu-ce-cosmos/Turkish-Llama-8b-DPO-v0.1 | 63.2 | Turkish-adapted Llama-8B via direct preference optimization |
Meta-Llama-3.1-8B-Instruct | 63.2 | Meta’s Llama-3.1-8B with instruct tuning |
RN_TR_R2 achieves a 17.6 pp improvement over the RN_TR_R1 baseline.
Base model: ytu-ce-cosmos/Turkish-Llama-8b-DPO-v0.1
Fine-tuning dataset: RefinedNeuro/Qwen3-Reasoning-Distill-Q-A-Dataset
unsloth
unsloth==2025.3.18
ollama run RefinedNeuro/RN_TR_R2
> **Q:** f(x) = 3x⁴ - 2x³ + 5x - 7 fonksiyonunun x = 1 noktasındaki türevini bulunuz.
>
> **A:** <think>
1. Adım: f(x) = 3x⁴ - 2x³ + 5x - 7 fonksiyonunun türevini bulmak için, önce f(x)'nin türevini bulmamız gerekmektedir.
2. Adım: Türevi bulmak için fonksiyonu parçalara ayırarak analiz edeceğiz.
f(x) = 3x⁴ - 2x³ + 5x - 7
3. Adım: Türevi bulmak için her terimi ayrı ayrı türevini buluyoruz.
- 3x⁴: Türevi 12x³'dür.
- -2x³: Türevi -6x²'dir.
- 5x: Türevi 5'dir.
- -7: Türevi 0'dır (çünkü sabit bir sayıdır).
4. Adım: Türevi bulmak için elde edilen türevleri birleştiriyoruz.
f'(x) = 12x³ - 6x² + 5
5. Adım: Şimdi x = 1 yerine koyarak f'(x)'nin türevini hesaplayacağız.
f'(1) = 12(1)³ - 6(1)² + 5
f'(1) = 12(1) - 6(1) + 5
f'(1) = 12 - 6 + 5
f'(1) = 11
6. Adım: x = 1 noktasındaki türevi 11 olarak bulduk.
\boxed{11}
</think>
\boxed{11}
Apache 2.0 — the most permissive open-source license.