318 6 months ago

deeptranslate-r2 是一个从 qwen3 微调而来的语言模型,专门用于英文和中文之间的高质量翻译。我们的模型使用监督式微调(SFT)技术,在仅有 0.6B 或 4B 参数的计算效率下实现高质量翻译。

tools thinking 0.6b 4b
4886eea4b06f · 81B
{
"num_predict": 512,
"repeat_penalty": 1.1,
"temperature": 0.1,
"top_k": 3,
"top_p": 0.3
}