deepseek-v2:16b-lite-chat-q4

deepseek-v2:16b-lite-chat-q4_1

1.1M Downloads Updated 1 year ago

A strong, economical, and efficient Mixture-of-Experts language model.

16b 236b

ollama run deepseek-v2:16b-lite-chat-q4_1

curl http://localhost:11434/api/chat \
  -d '{
    "model": "deepseek-v2:16b-lite-chat-q4_1",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='deepseek-v2:16b-lite-chat-q4_1',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'deepseek-v2:16b-lite-chat-q4_1',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Details

Updated 1 year ago

1 year ago

af64dfc98c26 · 9.9GB ·

model

archdeepseek2

parameters15.7B

quantizationQ4_1

9.9GB

license

14kB

params

{ "stop": [ "User:", "Assistant:" ] }

32B

template

{{ if .System }}{{ .System }} {{ end }}{{ if .Prompt }}User: {{ .Prompt }} {{ end }}Assistant:{{ .Re

111B

Readme

Note: this model requires Ollama 0.1.40.

DeepSeek-V2 is a a strong Mixture-of-Experts (MoE) language model characterized by economical training and efficient inference.

Note: this model is bilingual in English and Chinese.

The model comes in two sizes:

16B Lite: ollama run deepseek-v2:16b
236B: ollama run deepseek-v2:236b

References

GitHub