unsloth微调DeepSeek-R1-Distill-Llama-8B

ollama run fzkun/deepseek-r1-medical:8b

curl http://localhost:11434/api/chat \
  -d '{
    "model": "fzkun/deepseek-r1-medical:8b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='fzkun/deepseek-r1-medical:8b',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'fzkun/deepseek-r1-medical:8b',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Details

Updated 1 year ago

1 year ago

5dc321fca2b0 · 4.9GB ·

model

archllama

parameters8.03B

quantizationQ4_K_M

4.9GB

params

{ "num_ctx": 12800, "stop": [ "<｜begin▁of▁sentence｜>", "<｜end▁of

164B

template

{{- if .System }}{{ .System }}{{ end }} {{- range $i, $_ := .Messages }} {{- $last := eq (len (slice

387B

Readme

基于DeepSeek-R1-Distill-Llama-8B进行医疗数据集STF微调

数据集(FreedomIntelligence/medical-o1-reasoning-SFT数据集)

https://huggingface.co/datasets/FreedomIntelligence/medical-o1-reasoning-SFT

colab地址：

https://colab.research.google.com/drive/1N0Sf9yn8Tjs5gMJv-rez-0hzxBUDK3xK?usp=sharing#scrollTo=HvOPfPnet76H