575 Downloads Updated 1 month ago
ollama run yanjia/qwopus3.5-9b:q8_0
本模型为 Jackrong/Qwopus3.5-9B-v3 的 GGUF 量化版本,使用 llama.cpp 转换制作。
| Tag | 量化方式 | 文件大小 | 推荐显存 |
|---|---|---|---|
| Q8_0 | 8-bit 量化 | ~9.5 GB | ≥ 12 GB |
本模型继承原模型许可证:Apache 2.0
如在研究中使用,请引用原作者:
@misc{jackrong_qwen35_9b_v3, title = {Jackrong/Qwopus3.5-9B-v3}, author = {Jackrong}, year = {2026}, publisher = {Hugging Face}, howpublished = {\url{https://huggingface.co/Jackrong/Qwopus3.5-9B-v3}} }
原始模型由 llama.cpp convert_hf_to_gguf.py 转换为 F16 GGUF,
再使用 llama-quantize 量化。量化过程未对模型权重做其他修改。