TCYZ/ TEDLLM:latest

21 3 weeks ago

0.6b
ollama run TCYZ/TEDLLM

Details

3 weeks ago

19e7a447d931 · 301MB ·

llama
·
75.3M
<|user|> {{ .Prompt }} <|assistant|>
{ "repeat_last_n": 64, "repeat_penalty": 2, "stop": [ "</s>", "<|user|>"

Readme

🚀TEDLLM 600M: Yerli ve Özgün Dil Modeli

TEDLLM, Türkiye Cumhuriyeti Açık Kaynaklı Yapay Zeka (TCYZ) projesi vizyonuyla, Llama mimarisi temel alınarak sıfırdan (from scratch) eğitilmiş, kompakt ve yüksek performanslı bir dil modelidir.

🛠 Teknik Özellikler

Model, verimlilik ve hız odaklı bir mimari üzerine inşa edilmiştir:

Özellik Değer
Model Mimarisi Llama tabanlı (Causal LM)
Context Window 4096 (4K) Token
Hidden Size 512
Intermediate Size 2048
Katman Sayısı 12
Dikkat Kafaları 8 (Query) / 2 (KV - Grouped Query Attention)
Vocabulary Size 5000 (Türkçe Optimize)
Eğitim Cihazı Google TPU v5

🌟 Öne Çıkan Özellikler

  • GQA (Grouped Query Attention): 8K context desteği sunarken bellek kullanımını minimize eder.
  • RoPE (Rotary Positional Embeddings): Uzun metinlerde kelime sırasını ve bağlamı kaybetmez.
  • Özel Token Yapısı: <|user|> ve <|assistant|> etiketleriyle optimize edilmiş diyalog yeteneği.
  • Hafif ve Hızlı: Sadece 512 hidden size ile mobil cihazlarda ve yerel bilgisayarlarda (Ollama vb.) ışık hızında çalışır.

📂 Veri Seti ve Eğitim

TEDLLM, 15 temel bilgi düğümünün 1000 kat genişletilmesiyle oluşturulan 15.000 satırlık sentetik bir veri setiyle eğitilmiştir. Bu eğitim, modelin temel Türkçe dil yapısını, soru-cevap mantığını ve kurumsal kimliğini içselleştirmesini sağlamıştır.

🚀 Kurulum ve Kullanım

Modeli yerelinizde çalıştırmak için aşağıdaki adımları izleyebilirsiniz:

pip install TCYZ/tedllm