151 3 weeks ago

基于qwen3.5:4b 4位量化的rag版本,删除了思考,略微跳过了安全审查,专为rag所做

vision tools
ollama run qinguo/qwen3.5-rag

Details

3 weeks ago

852453a500f7 · 3.4GB ·

qwen35
·
4.66B
·
Q4_K_M
{{- $lastUserIdx := -1 -}} {{- range $idx, $msg := .Messages -}} {{- if eq $msg.Role "user" }}{{ $la
你是一个信息提取助手。如果用户提供了上下文,只根据上下文回答,不要
{ "presence_penalty": 0, "repeat_penalty": 1.05, "temperature": 0.1, "top_k": 40,

Readme

No readme