1 Download Updated 10 hours ago
ollama run Keyvan/german-ocr-nano
Updated 10 hours ago
10 hours ago
abac6f43c758 · 1.0GB ·
Deutsche Vision-OCR. Kompakt. Lokal. Open Source. Aus deutschem Rechnungs-/Brief-/Formular-Bild → strikt validiertes JSON.
ollama pull Keyvan/german-ocr-3
ollama run Keyvan/german-ocr-3 "Extrahiere die Rechnung im Bild als JSON." ./rechnung.png
Output (anonymisiertes Beispiel aus Praxistest):
{
"document_type": "invoice",
"language": "de",
"invoice_number": "100137xXXXXX",
"invoice_date": "2024-01-22",
"sender": {
"name": "IONOS SE",
"address": "Elgendorfer Str. 57, 56410 Montabaur",
"vat_id": "DE81556XXX"
},
"recipient": {
"name": "Firma e.K.",
"address": "Muster Straße 32, 80335 München",
"customer_id": "5835XXX"
},
"line_items": [
{"position": 1, "description": "Mail Business 1 Liz.", "quantity": 1, "unit_price_net": 4.20, "amount_net": 4.20, "vat_rate": 19}
],
"amount_total": 5.00,
"currency": "EUR"
}
| Modell | Größe | Wann nutzen |
|---|---|---|
Keyvan/german-ocr-nano |
1.0 GB | Edge, CPU-only, Phone, batch processing |
Keyvan/german-ocr-3 ⭐ |
2.7 GB | Empfohlen — beste Field-Erkennung, 4-6 GB VRAM |
# Empfohlen (2 B)
ollama pull Keyvan/german-ocr-3
# oder für CPU / Edge / Phone (0.8 B)
ollama pull Keyvan/german-ocr-nano
| Edition | Valid JSON | Sender korrekt | Halluzination | Latenz |
|---|---|---|---|---|
nano |
84 % | 79 % | 0 % | 6.6 s |
| default ⭐ | 100 % | 95 % | 0 % | 5.0 s |
Beide lesen das Bild — keine erfundenen „Mustermann GmbH”-Defaults.
German-OCR-3 extrahiert strukturierte Daten aus deutschen Geschäftsdokumenten (Rechnungen, Briefe, Formulare, Quittungen, Bescheide) direkt aus dem Bild — als strikt validiertes JSON.
temperature=0, top_k=1) für reproduzierbaren Outputneuralabs/german-synth-ocr · Aoschu/German_invoices_dataset_for_donut · eigenes synthetisches DE-Rechnungs-Set · IONOS-Praxistest (anonymisiert)schemas/invoice.json, schemas/letter.json, schemas/form.jsonGerman-OCR-3 baut auf der hervorragenden Arbeit des Qwen-Teams bei Alibaba Group auf. Die zugrundeliegende Vision-Language-Architektur stammt aus der Qwen 3.5 Small Series, veröffentlicht unter Apache License 2.0.
Apache License 2.0.
@misc{german_ocr_3_2026,
title = {German-OCR-3: A compact German document-OCR distribution},
author = {Hardani, Keyvan},
year = {2026},
url = {https://github.com/Keyvanhardani/German-OCR}
}
@misc{qwen35_2026,
title = {Qwen 3.5 Small Series},
author = {{Qwen Team, Alibaba Group}},
year = {2026},
howpublished = {\url{https://huggingface.co/Qwen}},
note = {Apache License 2.0}
}
Keyvan Hardani · Website: keyvan.ai · LinkedIn: linkedin.com/in/keyvanhardani · GitHub: @Keyvanhardani