11 1 month ago

GGUF Ruadapt версии модели Qwen/Qwen3-32B (квантизованная версия Q4_K_M)

tools thinking 32b

Models

View all →

Readme

Основано на https://huggingface.co/RefalMachine/RuadaptQwen3-32B-Instruct-GGUF

Характеристика Значение
VLM false
think true
tools true
speed 31 token/s

Характеристики примерные, проверялось на rtx3090 24GB