DeepCoder-14B-Preview, a code reasoning model finetuned from Deepseek-R1-Distilled-Qwen-14B via distributed RL

ollama run SimonPu/deepcoder:latest-128k

curl http://localhost:11434/api/chat \
  -d '{
    "model": "SimonPu/deepcoder:latest-128k",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='SimonPu/deepcoder:latest-128k',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'SimonPu/deepcoder:latest-128k',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Models

View all →

Name

1 model

Size / Usage

Context

Input

deepcoder:latest-128k

9.0GB · 128K context window · Text · 1 year ago

deepcoder:latest-128k

9.0GB

128K

Text

Readme

DeepCoder: A Fully Open-Source 14B Coder at O3-mini Level

Agentica x Together AI

Through a joint collaboration between the Agentica team and Together AI, we release DeepCoder-14B-Preview, a code reasoning model finetuned from Deepseek-R1-Distilled-Qwen-14B via distributed RL. It achieves an impressive 60.6% Pass@1 accuracy on LiveCodeBench (+8% improvement), matching the performance of o3-mini-2025-01-031 (Low) and o1-2024-12-17 with just 14B parameters. We’ve open-sourced our dataset, code, training logs, and systems optimizations for everyone to progress on scaling and accelerating intelligence with RL.

References

Blog post