622 2 weeks ago

第二代 OmniCoder,基于 Qwen3.5-9B 微调。仅对助手 token 进行训练(与 v1 不同):不再出现重复循环,在长时间的智能体会话中能够稳定进行工具调用。 原文链接:https://hf.co/Tesslate/OmniCoder-2-9B

tools thinking
ollama run 64500165/omnicoder-2-9b-Q4-K-M

Details

2 weeks ago

a73b1afbd71f · 5.7GB ·

qwen35
·
8.95B
·
Q4_K_M
你是OmniCoder2号(OmniCoder 2),一位经过智能软件工程轨迹训练的专业编程助
{ "num_ctx": 65536, "repeat_penalty": 1, "stop": [ "<|im_start|>", "<|im
{{- $lastUserIdx := -1 -}} {{- range $idx, $msg := .Messages -}} {{- if eq $msg.Role "user" }}{{ $la

Readme

基于 42.5 万条智能体编程轨迹对 Qwen3.5-9B 进行的微调:这些轨迹包括终端智能体运行、SWE-bench 补丁以及工具调用序列。本模型专为 IDE 编程智能体(如 OpenCode、Cline、Roo Code)以及终端流水线设计,并非用于通用聊天。

v2 版本仅对助手 token 进行训练。v1 版本则训练了包括模板样板代码在内的所有 token,这导致了重复循环以及在长时间会话中工具调用不稳定的问题。v2 版本还在每一轮对话中保留了“思考”块,使得模型能够在一个多步骤会话的全程进行推理,而不仅仅是在最终答案时才进行思考。

支持本地化模型的openclaw,能调用工具及任务执行。

在I5-12400f cpu + 32G内存 + gtx1050ti-4G上正常运行openclaw。

ScreenShot_2026-04-15_111511_906.png