rzline/ Tifa-Deepsex-14b-CoT-Chat-Q8.gguf:latest

985 Downloads Updated 1 year ago

ollama run rzline/Tifa-Deepsex-14b-CoT-Chat-Q8.gguf

curl http://localhost:11434/api/chat \
  -d '{
    "model": "rzline/Tifa-Deepsex-14b-CoT-Chat-Q8.gguf",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='rzline/Tifa-Deepsex-14b-CoT-Chat-Q8.gguf',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'rzline/Tifa-Deepsex-14b-CoT-Chat-Q8.gguf',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Details

Updated 1 year ago

1 year ago

8412d9d22390 · 16GB ·

model

archqwen2

parameters14.8B

quantizationQ8_0

16GB

Readme

Tifa-Deepsex-14b-CoT-Chat-Q8

Hugging Face仓库激进版本 F16 Q4量化

本模型基于Deepseek-R1-14B进行深度优化，借助Tifa_220B生成的数据集通过三重训练策略显著增强角色扮演、小说文本生成与思维链（CoT）能力。特别适合需要长程上下文关联的创作场景。

仅转存模型，暂无修改

采用标准数据训练，使用成熟RL策略，附加防重复强化学习，适合正常使用，输出文本质量正常，少数情况下思维发散。
增量训练0.4T小说内容
100K由TifaMax生成的SFT数据，10K由DeepseekR1生成的SFT数据，2K高质量人工数据
30K由TifaMax生成的DPO强化学习数据，用于防止重复，增强上下文关联，提升政治安全性