mikepfunk28/deepseekq3

mikepfunk28/ deepseekq3_agent:latest

595 Downloads Updated 11 months ago

16k Context Window meaning you need less RAM to run this. It's full context windows is loaded in the deepseekq3_coder. It allocates the RAM needed for the context when loading the model.

tools thinking

ollama run mikepfunk28/deepseekq3_agent

curl http://localhost:11434/api/chat \
  -d '{
    "model": "mikepfunk28/deepseekq3_agent",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='mikepfunk28/deepseekq3_agent',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'mikepfunk28/deepseekq3_agent',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Details

Updated 11 months ago

11 months ago

b37cd58f6fd3 · 5.2GB ·

model

archqwen3

parameters8.19B

quantizationQ4_K_M

5.2GB

license

1.1kB

template

1.9kB

system

# Devstral - Advanced Coding Assistant System Prompt You are Devstral, an elite coding assistant eng

14kB

params

{ "num_ctx": 16000, "seed": 42, "stop": [ "<｜begin▁of▁sentence｜>",

216B

Readme

No readme