407 9 months ago

Models

View all →

Readme

0218更新-(进度15%,动态思维链)

  • 更新中间版本 Tifa-DeepsexV2-7b-MGRPO-0218,大幅减少发散、提高推理能力、惩罚多个过拟合词,自动选择是否进行深度思考(测试)
  • Q8