175 Downloads Updated 10 months ago
Name
1 model
Size
Context
Input
Tifa-Deepsex-14b-CoT-Chat-IQ4_NL.gguf:latest
8.6GB · 128K context window · Text · 10 months ago
8.6GB
128K
Text
Hugging Face仓库 激进版本 F16 Q8量化
采用标准数据训练,使用成熟RL策略,附加防重复强化学习,适合正常使用,输出文本质量正常,少数情况下思维发散。
增量训练0.4T小说内容
100K由TifaMax生成的SFT数据,10K由DeepseekR1生成的SFT数据,2K高质量人工数据
30K由TifaMax生成的DPO强化学习数据,用于防止重复,增强上下文关联,提升政治安全性