pielee/qwen3-4b-thinking-2507

pielee/ qwen3-4b-thinking-2507_q8:latest

1,242 Downloads Updated 10 months ago

Qwen3-4B-Thinking-2507_q8: A 4-billion-parameter inference model with 8-bit quantization, optimized for efficient reasoning in resource-constrained environments.

tools thinking

ollama run pielee/qwen3-4b-thinking-2507_q8

curl http://localhost:11434/api/chat \
  -d '{
    "model": "pielee/qwen3-4b-thinking-2507_q8",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='pielee/qwen3-4b-thinking-2507_q8',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'pielee/qwen3-4b-thinking-2507_q8',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Details

Updated 10 months ago

10 months ago

385fd1a5edde · 4.3GB ·

model

archqwen3

parameters4.02B

quantizationQ8_0

4.3GB

template

{{- $lastUserIdx := -1 -}} {{- range $idx, $msg := .Messages -}} {{- if eq $msg.Role "user" }}{{ $la

1.5kB

system

You are Qwen3, created by Alibaba Cloud. You are a helpful assistant.

69B

params

{ "repeat_penalty": 1, "stop": [ "<|im_start|>", "<|im_end|>" ], "te

120B

Readme

No readme