richardyoung/ sensenova-si-2b

5 Downloads Updated 1 month ago

sensenova-si-2b is a ~2B-parameter Qwen2-architecture model from sensenova/sensenova-si (built on OpenGVLab’s InternVL3‑2B) converted to GGUF for llama.cpp/Ollama, with 32K context and two published quants: Q4_K_M (recommended) and iq4_xs (smaller).

ollama run richardyoung/sensenova-si-2b:Q4_K_M

curl http://localhost:11434/api/chat \
  -d '{
    "model": "richardyoung/sensenova-si-2b:Q4_K_M",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

from ollama import chat

response = chat(
    model='richardyoung/sensenova-si-2b:Q4_K_M',
    messages=[{'role': 'user', 'content': 'Hello!'}],
)
print(response.message.content)

import ollama from 'ollama'

const response = await ollama.chat({
  model: 'richardyoung/sensenova-si-2b:Q4_K_M',
  messages: [{role: 'user', content: 'Hello!'}],
})
console.log(response.message.content)

Models

Name

2 models

Size

Context

Input

sensenova-si-2b:Q4_K_M

1.1GB · 32K context window · Text · 1 month ago

sensenova-si-2b:Q4_K_M

1.1GB

32K

Text

sensenova-si-2b:iq4_xs

1.0GB · 32K context window · Text · 1 month ago

sensenova-si-2b:iq4_xs

1.0GB

32K

Text

Readme

SenseNova-SI-2B: GGUF quantizations for Ollama

Overview

SenseNova-SI-2B is a GGUF conversion of sensenova/sensenova-si for llama.cpp / Ollama. Upstream: https://huggingface.co/sensenova/sensenova-si

Notes

Alias matches existing local artifacts; adjust if needed.

Key Details

Prompt format: ChatML
Architecture: qwen2
Size label: 2B
Context length: 32768
License (from GGUF metadata): apache-2.0
Base model: OpenGVLab — InternVL3 2B — https://huggingface.co/OpenGVLab/InternVL3-2B

Status

Local GGUFs: present

Available Versions

Tag	GGUF	Size	RAM (est.)	Notes
`IQ4_XS`	`SenseNova-SI-2B-IQ4_XS.gguf`	0.96 GiB	2 GiB
`Q4_K_M`	`SenseNova-SI-2B-Q4_K_M.gguf`	1.04 GiB	3 GiB	Recommended

Quick Start

ollama run richardyoung/sensenova-si-2b:q4_k_m "Hello!"

Available Commands

ollama run richardyoung/sensenova-si-2b:iq4_xs
ollama run richardyoung/sensenova-si-2b:q4_k_m

License

See the upstream repo for license/terms: https://huggingface.co/sensenova/sensenova-si

Acknowledgments

Quantized with llama.cpp (llama-quantize).
GGUF conversion via llama.cpp (convert_hf_to_gguf.py).

# SenseNova-SI-2B: GGUF quantizations for Ollama

## Overview
`SenseNova-SI-2B` is a GGUF conversion of `sensenova/sensenova-si` for llama.cpp / Ollama.
Upstream: https://huggingface.co/sensenova/sensenova-si

## Notes
Alias matches existing local artifacts; adjust if needed.

## Key Details
- Prompt format: `ChatML`
- Architecture: `qwen2`
- Size label: `2B`
- Context length: `32768`
- License (from GGUF metadata): `apache-2.0`
- Base model: OpenGVLab — InternVL3 2B — https://huggingface.co/OpenGVLab/InternVL3-2B

## Status
- Local GGUFs: present

## Available Versions

| Tag | GGUF | Size | RAM (est.) | Notes |
|---|---|---:|---:|---|
| `IQ4_XS` | `SenseNova-SI-2B-IQ4_XS.gguf` | 0.96 GiB | 2 GiB |  |
| `Q4_K_M` | `SenseNova-SI-2B-Q4_K_M.gguf` | 1.04 GiB | 3 GiB | Recommended |

## Quick Start

```bash
ollama run richardyoung/sensenova-si-2b:q4_k_m "Hello!"
```

## Available Commands
- `ollama run richardyoung/sensenova-si-2b:iq4_xs`
- `ollama run richardyoung/sensenova-si-2b:q4_k_m`

## License
See the upstream repo for license/terms: https://huggingface.co/sensenova/sensenova-si

## Acknowledgments
- Quantized with llama.cpp (`llama-quantize`).
- GGUF conversion via llama.cpp (`convert_hf_to_gguf.py`).

Paste, drop or click to upload images (.png, .jpeg, .jpg, .svg, .gif)