16 Downloads Updated yesterday
ollama run Keyvan/german-ocr-3.1
Updated yesterday
yesterday
9f9572ba8ff8 · 3.4GB ·
![]()
Deutsche Vision-OCR. Engineered + optimiert. Lokal. Open Source.
Aus deutschem Rechnungs-/Brief-/Formular-Bild → strikt validiertes JSON.
Teil der German-OCR-3 Kollektion — Nachfolger von Keyvan/german-ocr-3.
ollama pull Keyvan/german-ocr-3.1
ollama run Keyvan/german-ocr-3.1 "Extrahiere die Rechnung im Bild als JSON." ./rechnung.png
Output (anonymisiertes Beispiel aus Praxistest):
{
"document_type": "invoice",
"language": "de",
"invoice_number": "100137xXXXXX",
"invoice_date": "2024-01-22",
"sender": {
"name": "IONOS SE",
"address": "Elgendorfer Str. 57, 56410 Montabaur",
"vat_id": "DE81556XXX",
"iban": "DE81 1234 XXXX XXXX XXXX 13"
},
"recipient": {
"name": "Firma e.K.",
"address": "Muster Straße 32, 80335 München",
"customer_id": "5835XXX"
},
"line_items": [
{"position": 1, "description": "Mail Business 1 Liz.",
"quantity": 1, "unit_price_net": 4.20, "amount_net": 4.20, "vat_rate": 19}
],
"amount_net": 4.20,
"amount_vat": 0.80,
"amount_total": 5.00,
"currency": "EUR"
}
| Modell | Größe | Wann nutzen |
|---|---|---|
Keyvan/german-ocr-3.1 ⭐ |
~3 GB | Empfohlen — engineered + optimierte Config, Vision aktiv, 4-6 GB VRAM |
Keyvan/german-ocr-3 |
2.7 GB | Vorgänger-Generation, weiterhin verfügbar |
Mehrere Quants auf Hugging Face für unterschiedliche Hardware: Keyven/german-ocr-3.1 — Q4_K_M (941 MB) · Q8_0 (1.6 GB) · F16 (2.9 GB) · plus mmproj-Sidecar für llama-server.
# Empfohlen
ollama pull Keyvan/german-ocr-3.1
# Vorgänger
ollama pull Keyvan/german-ocr-3
| Test | Valid JSON | Sender korrekt | Halluzination | Latenz |
|---|---|---|---|---|
| Reisebüro-Rechnung (real_000) | 100 % | ✓ Reisebüro Kronenberger | 0 % | 3.55 s |
| Werbeagentur-Rechnung (real_001) | 100 % | ✓ Werbeagentur Kluger | 0 % | 2.94 s |
| Hardware-Rechnung (real_002) | 100 % | ✓ Ihr Firmenname GmbH | 0 % | 2.14 s |
4⁄4 Tests grün, 100 % JSON-Validität, korrekte sender/recipient/line_items/amount_total in allen Fällen.
Keine erfundenen „Mustermann GmbH”-Defaults — lieber null als geraten.
German-OCR-3.1 extrahiert strukturierte Daten aus deutschen Geschäftsdokumenten (Rechnungen, Briefe, Formulare, Quittungen, Bescheide) direkt aus dem Bild — als strikt validiertes JSON.
temperature=0) für reproduzierbaren Output| Was | Wo | |
|---|---|---|
| 👁 German-OCR-3.1 | Vision OCR (du bist hier) | ollama.com |
| 🇩🇪 German-Text-3.1 | Text-Assistent für Übersetzung, Zusammenfassung, Chat | ollama.com |
| ☁️ German-OCR Cloud API | Managed Service, höhere Genauigkeit, EU-DSGVO | german-ocr.de |
| 📝 German-OCR for Word | Office Add-in | office.german-ocr.de |
German-OCR-3.1 baut auf der hervorragenden Arbeit des Qwen-Teams bei Alibaba Group auf. Die zugrundeliegende Vision-Language-Architektur stammt aus der Qwen 3.5 Small Series, veröffentlicht unter Apache License 2.0.
Apache License 2.0.
@misc{german_ocr_3_1_2026,
title = {German-OCR-3.1: Engineered + optimierte Distribution für deutsche Geschäftsdokumente},
author = {Hardani, Keyvan},
year = {2026},
url = {https://github.com/Keyvanhardani/German-OCR}
}
@misc{qwen35_2026,
title = {Qwen 3.5 Small Series},
author = {{Qwen Team, Alibaba Group}},
year = {2026},
howpublished = {\url{https://huggingface.co/Qwen}},
note = {Apache License 2.0}
}
Keyvan Hardani · Website: keyvan.ai · LinkedIn: linkedin.com/in/keyvanhardani · GitHub: @Keyvanhardani