uaysk0327/nemotron-3-nano:30b-q4_k

uaysk0327/ nemotron-3-nano:30b-q4_k_xl

64 Downloads Updated 4 months ago

tools

ollama run uaysk0327/nemotron-3-nano:30b-q4_k_xl

curl http://localhost:11434/api/chat \
  -d '{
    "model": "uaysk0327/nemotron-3-nano:30b-q4_k_xl",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='uaysk0327/nemotron-3-nano:30b-q4_k_xl',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'uaysk0327/nemotron-3-nano:30b-q4_k_xl',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Details

Updated 4 months ago

4 months ago

69fb2351a54f · 23GB ·

model

archnemotron_h_moe

parameters31.6B

quantizationQ4_K_M

23GB

license

NVIDIA Open Model License Agreement Last Modified: October 24, 2025 This NVIDIA Open Model License A

10kB

params

{ "num_ctx": 92160, "temperature": 0.85, "top_p": 1 }

47B

template

13B

Readme

Able to use 92160 Context if you enable q8_0 kv cache quantize in 24GB VRAM, ollama’s official model is using q4_k_m and this model is using q4_k_xl so it can be fit in 24GB VRAM