16 yesterday

Deutsche Vision-OCR. Engineered + optimiert. Lokal. Open Source. Aus deutschem

vision tools thinking
ollama run Keyvan/german-ocr-3.1

Details

yesterday

9f9572ba8ff8 · 3.4GB ·

qwen35
·
4.66B
·
Q4_K_M
Apache License Version 2.0, January 2004 http://www.apache.org/licenses/ TERMS AND CONDITIONS FOR US
Du bist German-OCR-3.1, eine deutschsprachige OCR- und Dokument-Extraktionsdistribution von Keyvan.a
{ "num_predict": 2000, "presence_penalty": 1.5, "stop": [ "<|im_end|>",

Readme

German-OCR-3.1

German-OCR-3.1

Deutsche Vision-OCR. Engineered + optimiert. Lokal. Open Source. Aus deutschem Rechnungs-/Brief-/Formular-Bild → strikt validiertes JSON. Teil der German-OCR-3 Kollektion — Nachfolger von Keyvan/german-ocr-3.

Quickstart

ollama pull Keyvan/german-ocr-3.1
ollama run Keyvan/german-ocr-3.1 "Extrahiere die Rechnung im Bild als JSON." ./rechnung.png

Output (anonymisiertes Beispiel aus Praxistest):

{
  "document_type": "invoice",
  "language": "de",
  "invoice_number": "100137xXXXXX",
  "invoice_date": "2024-01-22",
  "sender": {
    "name": "IONOS SE",
    "address": "Elgendorfer Str. 57, 56410 Montabaur",
    "vat_id": "DE81556XXX",
    "iban": "DE81 1234 XXXX XXXX XXXX 13"
  },
  "recipient": {
    "name": "Firma e.K.",
    "address": "Muster Straße 32, 80335 München",
    "customer_id": "5835XXX"
  },
  "line_items": [
    {"position": 1, "description": "Mail Business 1 Liz.",
     "quantity": 1, "unit_price_net": 4.20, "amount_net": 4.20, "vat_rate": 19}
  ],
  "amount_net": 4.20,
  "amount_vat": 0.80,
  "amount_total": 5.00,
  "currency": "EUR"
}

Editions

Modell Größe Wann nutzen
Keyvan/german-ocr-3.1 ~3 GB Empfohlen — engineered + optimierte Config, Vision aktiv, 4-6 GB VRAM
Keyvan/german-ocr-3 2.7 GB Vorgänger-Generation, weiterhin verfügbar

Mehrere Quants auf Hugging Face für unterschiedliche Hardware: Keyven/german-ocr-3.1 — Q4_K_M (941 MB) · Q8_0 (1.6 GB) · F16 (2.9 GB) · plus mmproj-Sidecar für llama-server.

# Empfohlen
ollama pull Keyvan/german-ocr-3.1

# Vorgänger
ollama pull Keyvan/german-ocr-3

Praxistest (echte anonymisierte deutsche Rechnungen)

Test Valid JSON Sender korrekt Halluzination Latenz
Reisebüro-Rechnung (real_000) 100 % Reisebüro Kronenberger 0 % 3.55 s
Werbeagentur-Rechnung (real_001) 100 % Werbeagentur Kluger 0 % 2.94 s
Hardware-Rechnung (real_002) 100 % Ihr Firmenname GmbH 0 % 2.14 s

44 Tests grün, 100 % JSON-Validität, korrekte sender/recipient/line_items/amount_total in allen Fällen. Keine erfundenen „Mustermann GmbH”-Defaults — lieber null als geraten.

Model Description

German-OCR-3.1 extrahiert strukturierte Daten aus deutschen Geschäftsdokumenten (Rechnungen, Briefe, Formulare, Quittungen, Bescheide) direkt aus dem Bild — als strikt validiertes JSON.

  • Base Model: Qwen 3.5 Small Series · Apache 2.0
  • Extraktions-Layer: deutscher Anti-Halluzinations-System-Prompt mit striktem JSON-Schema
  • Engineering: brand-konsistente Identity-Konfiguration, Vision aktiviert, sauberer Output ohne Thinking-Leak
  • Decoding: greedy (temperature=0) für reproduzierbaren Output
  • License: Apache 2.0

Training

  • Methode: Prompt-Edition (engineered + optimierter System-Prompt-Stack auf vision-fähiger Base)
  • Sampling: greedy (deterministisch)
  • Schema-basiert: strikte Extraktion nach Invoice/Letter/Form/Receipt/Bescheid/Vertrag-Schemas

Limitations

  • Optimiert für deutsche Dokumente — Ergebnisse in anderen Sprachen nicht garantiert
  • Beste Qualität bei klaren, hochauflösenden Scans/Fotos
  • Handschriftliche Dokumente: nur begrenzt
  • Bei kritischen Vorgängen (Buchhaltung, Recht): immer Human-in-the-Loop

Companion-Modelle

Was Wo
👁 German-OCR-3.1 Vision OCR (du bist hier) ollama.com
🇩🇪 German-Text-3.1 Text-Assistent für Übersetzung, Zusammenfassung, Chat ollama.com
☁️ German-OCR Cloud API Managed Service, höhere Genauigkeit, EU-DSGVO german-ocr.de
📝 German-OCR for Word Office Add-in office.german-ocr.de

Credit & Attribution

German-OCR-3.1 baut auf der hervorragenden Arbeit des Qwen-Teams bei Alibaba Group auf. Die zugrundeliegende Vision-Language-Architektur stammt aus der Qwen 3.5 Small Series, veröffentlicht unter Apache License 2.0.

License

Apache License 2.0.

Citation

@misc{german_ocr_3_1_2026,
  title  = {German-OCR-3.1: Engineered + optimierte Distribution für deutsche Geschäftsdokumente},
  author = {Hardani, Keyvan},
  year   = {2026},
  url    = {https://github.com/Keyvanhardani/German-OCR}
}

@misc{qwen35_2026,
  title        = {Qwen 3.5 Small Series},
  author       = {{Qwen Team, Alibaba Group}},
  year         = {2026},
  howpublished = {\url{https://huggingface.co/Qwen}},
  note         = {Apache License 2.0}
}

Links

Author

Keyvan Hardani · Website: keyvan.ai · LinkedIn: linkedin.com/in/keyvanhardani · GitHub: @Keyvanhardani