DeepCoder-14B-Preview, a code reasoning model finetuned from Deepseek-R1-Distilled-Qwen-14B via distributed RL

ollama run SimonPu/deepcoder:latest-128k

curl http://localhost:11434/api/chat \
  -d '{
    "model": "SimonPu/deepcoder:latest-128k",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='SimonPu/deepcoder:latest-128k',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'SimonPu/deepcoder:latest-128k',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Details

Updated 9 months ago

9 months ago

8b5ccbeb7d2b · 9.0GB ·

model

archqwen2

parameters14.8B

quantizationQ4_K_M

9.0GB

license

1.1kB

license

1.1kB

params

{ "num_ctx": 131072, "temperature": 0.6, "top_p": 0.95 }

50B

template

{{- if .System }}{{ .System }}{{ end }} {{- range $i, $_ := .Messages }} {{- $last := eq (len (slice

394B

Readme

DeepCoder: A Fully Open-Source 14B Coder at O3-mini Level

Agentica x Together AI

Through a joint collaboration between the Agentica team and Together AI, we release DeepCoder-14B-Preview, a code reasoning model finetuned from Deepseek-R1-Distilled-Qwen-14B via distributed RL. It achieves an impressive 60.6% Pass@1 accuracy on LiveCodeBench (+8% improvement), matching the performance of o3-mini-2025-01-031 (Low) and o1-2024-12-17 with just 14B parameters. We’ve open-sourced our dataset, code, training logs, and systems optimizations for everyone to progress on scaling and accelerating intelligence with RL.

References

Blog post