robbiemu/qwen3-coder:30b-a3b-i-q4_K

robbiemu/ qwen3-coder:30b-a3b-i-q4_K_XL

372 Downloads Updated 10 months ago

tools

ollama run robbiemu/qwen3-coder:30b-a3b-i-q4_K_XL

curl http://localhost:11434/api/chat \
  -d '{
    "model": "robbiemu/qwen3-coder:30b-a3b-i-q4_K_XL",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='robbiemu/qwen3-coder:30b-a3b-i-q4_K_XL',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'robbiemu/qwen3-coder:30b-a3b-i-q4_K_XL',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Details

Updated 10 months ago

10 months ago

b37ca1b42110 · 18GB ·

model

archqwen3moe

parameters30.5B

quantizationQ4_K_M

18GB

template

{{- /* Extract system message and other messages */ -}} {{- $system_message := "" -}} {{- $loop_mess

4.1kB

system

You are an interactive CLI tool that helps users with software engineering tasks. Use available tool

1.4kB

license

Apache License Version 2.0

26B

params

{ "min_p": 0, "num_ctx": 65536, "repeat_penalty": 1.05, "stop": [ "<|im_star

174B

Readme

This is unsloth’s popular quantization (https://huggingface.co/unsloth/Qwen3-Coder-30B-A3B-Instruct-GGUF/blob/main/Qwen3-Coder-30B-A3B-Instruct-UD-Q4_K_XL.gguf) with tool calling based on the discussion: https://github.com/ggml-org/llama.cpp/issues/15012

Apologies about the num_ctx being lower than the model’s actual supported maximum.