evilfreelancer/ o1_gigachat:20b

912 Downloads Updated 1 year ago

Russian o1-like "thinking" LLM based on GigaChat 20B-A3B

20b

ollama run evilfreelancer/o1_gigachat:20b

curl http://localhost:11434/api/chat \
  -d '{
    "model": "evilfreelancer/o1_gigachat:20b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='evilfreelancer/o1_gigachat:20b',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'evilfreelancer/o1_gigachat:20b',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Details

Updated 1 year ago

1 year ago

323d75962a42 · 22GB ·

model

archdeepseek

·

parameters20.6B

·

quantizationQ8_0

22GB

system

Вы — ИИ-помощник. Отформатируйте свои ответы следующи�

240B

params

{ "num_ctx": 8192, "stop": [ "<|message_sep|>", "</s>" ], "temperatu

89B

template

{{ range .Messages }} {{ if eq .Role "system" }}system<|role_sep|>{{ .Content }}<|message_sep|>{{ en

393B

Readme

Russian o1 / GigaChat 20B-A3B LoRA

Важно: данная модель требует Ollama 0.5.6 или новее, скачать тут.

LoRA-адаптер для MoE модели GigaChat-20B-A3B-instruct на 20B параметров из которых активно только 3B. На этапе обучения использовался Egor-AI/Russian_thinking_dataset (машинный перевод на русский язык датасета BintangFortuna/OpenO1-SFT-EN-SY).

Модель способна имитировать логические размышлению на русском языке по аналогии с тем, как это делает o1 от OpenAI.

Необходимо использовать следующего вида системный промт:

Вы — ИИ-помощник. Отформатируйте свои ответы следующим образом: <Thought> Ваши мысли (понимание, рассуждения) </Thought> <output> Ваш ответ </output>

Обучение производилось при помощи утилиты impruver используя конфигурацию GigaChat/20B-A3B_lora_o1.

# Russian o1 / GigaChat 20B-A3B LoRA

> Важно: данная модель требует Ollama 0.5.6 или новее, [скачать тут](https://ollama.com/download).

* https://huggingface.co/evilfreelancer/o1_gigachat-20b-a3b_lora
* https://huggingface.co/evilfreelancer/o1_gigachat-20b-a3b_gguf

LoRA-адаптер для MoE модели [GigaChat-20B-A3B-instruct](https://huggingface.co/ai-sage/GigaChat-20B-A3B-instruct-bf16) на 20B параметров из которых активно только 3B. На этапе обучения использовался [Egor-AI/Russian_thinking_dataset](https://huggingface.co/datasets/Egor-AI/Russian_thinking_dataset) (машинный
перевод на русский язык
датасета [BintangFortuna/OpenO1-SFT-EN-SY](https://huggingface.co/datasets/BintangFortuna/OpenO1-SFT-EN-SY)).

Модель способна имитировать логические размышлению на русском языке по аналогии с тем, как это делает `o1` от `OpenAI`.

Необходимо использовать следующего вида системный промт:

```
Вы — ИИ-помощник. Отформатируйте свои ответы следующим образом: <Thought> Ваши мысли (понимание, рассуждения) </Thought> <output> Ваш ответ </output>
```

Обучение производилось при помощи утилиты [impruver](https://github.com/EvilFreelancer/impruver) используя конфигурацию
[GigaChat/20B-A3B_lora_o1](https://github.com/EvilFreelancer/impruver/blob/main/recipes/configs/GigaChat/20B-A3B_lora_o1.yaml).

Paste, drop or click to upload images (.png, .jpeg, .jpg, .svg, .gif)