MHKetbi/DeepScaleR-1.5B-Preview/license

MHKetbi/

DeepScaleR-1.5B-Preview

DeepScaleR-1.5B-Preview is a language model fine-tuned from DeepSeek-R1-Distilled-Qwen-1.5B using distributed reinforcement learning (RL)

65 Pulls Updated 7 weeks ago

DeepScaleR-1.5B-Preview ... /

license

78198e7ab262 · 3B

mit