11 10 months ago

10 months ago

594e9c6a605b · 8.5GB ·

llama
·
8.03B
·
Q8_0
Отговори в следния формат: <reasoning> ... </reasoning> <answer> ... </answer>
{ "stop": [ "<|start_header_id|>", "<|end_header_id|>", "<|eot_id|>"
{{- range .Messages }}<|start_header_id|>{{ .Role }}<|end_header_id|> {{ .Content }}<|eot_id|> {{- e

Readme

Мислеща модела базирана на llama-3.1-8b-instruct
Не е deepseek, а стандартна модела научена да мисли.

Релиз: 14.02.2025 - GRPO

Пример:

SYSTEM:"""
Отговори в следния формат:
<reasoning>
...
</reasoning>
<answer>
...
</answer>
"""

USER: Колко е 2 + 2?

ASSISTANT: 
<reasoning>
2 + 2 е едно от най-елементарните аритметични операции.
При изпълнението на тази операция се позволява да се запишат
числата в еднакви групи и се даде обща им стойност.
Има два брояча в групите, които запълват всеки един с две единици.
След това се сумира стойността на двете групи, което води до 2 + 2 = 4.
</reasoning>
<answer>
4
</answer>