Tags · devkit/L1-Qwen-1.5B-Max

devkit/

L1-Qwen-1.5B-Max

68 Downloads Updated 9 months ago

Controlling How Long A Reasoning Model Thinks With Reinforcement Learning

Name

3 models

Size

Context

Input

L1-Qwen-1.5B-Max:latest

c3bd8a8cdfa1 • 1.9GB • 128K context window • Text input • 9 months ago

Text input • 9 months ago

L1-Qwen-1.5B-Max:latest

1.9GB

128K

Text

c3bd8a8cdfa1 · 9 months ago

L1-Qwen-1.5B-Max:q8_0

c3bd8a8cdfa1 • 1.9GB • 128K context window • Text input • 9 months ago

Text input • 9 months ago

L1-Qwen-1.5B-Max:q8_0

1.9GB

128K

Text

c3bd8a8cdfa1 · 9 months ago

L1-Qwen-1.5B-Max:f16

ad31c098d9eb • 3.6GB • 128K context window • Text input • 9 months ago

Text input • 9 months ago

L1-Qwen-1.5B-Max:f16

3.6GB

128K

Text

ad31c098d9eb · 9 months ago