146 5 months ago

GLM-4-Z1-32B-0414是新一代开源推理模型。它的性能可与 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列相媲美,此模型使用Ollama v0.6.6版本制作生成,需要Ollama v0.6.6及以上版本才能运行推理。

Models

View all →

Readme

This model requires Ollama v0.6.6 or later

下载并推理:ollama run lsm03624/GLM-Z1-32B-0414-Q4_K_M --verbose

说明:该模型的Q4_K_M量化版本在单卡3090上运行占用21G显存左右,生成速度30 tokens/s左右。

GLM-4-Z1-32B-0414 介绍 GLM 系列迎来了新一代开源模型,即 GLM-4-32B-0414 系列,具有 320 亿个参数。它的性能可与 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列相媲美,并支持非常用户友好的本地部署功能。GLM-4-32B-Base-0414 在 15T 的高质量数据上进行了预训练,其中包括大量的推理型合成数据,为后续的强化学习扩展奠定了基础。在后训练阶段,除了人类对对话场景的偏好对齐外,我们还使用拒绝采样和强化学习等技术增强了模型在指令跟随、工程代码和函数调用方面的性能,增强了智能体任务所需的原子能力。GLM-4-32B-0414 在工程代码、工件生成、函数调用、基于搜索的 Q&A 和报告生成等领域取得了良好的效果。一些基准测试甚至与 GPT-4o 和 DeepSeek-V3-0324 (671B) 等更大的模型相媲美。

GLM-Z1-32B-0414 是一个具有深度思考能力的推理模型。这是基于 GLM-4-32B-0414 开发的,通过冷启动和扩展强化学习,以及在涉及数学、代码和逻辑的任务上对模型进行进一步训练。与基本模型相比,GLM-Z1-32B-0414 显著提高了数学能力和解决复杂任务的能力。在训练过程中,我们还引入了基于成对排名反馈的通用强化学习,进一步增强了模型的通用能力。