7 Downloads Updated 6 hours ago
Ultraschnelle deutsche Texterkennung mit 100% Genauigkeit
Das schnellste OCR-Modell fuer deutsche Dokumente - 3x schneller als DeepSeek-OCR!
Getestet auf RTX 4060 8GB mit 5x Warm-Runs:
| Modell | Groesse | Zeit | Genauigkeit |
|---|---|---|---|
| German-OCR Turbo | 1.9GB | 5.0s | 100% |
| German-OCR v1 | 3.2GB | 5.5s | 75% |
| DeepSeek-OCR | 6.7GB | 15.8s | 70% |
| MiniCPM-V | 5.5GB | 8.9s | 67% |
| LLaVA 7B | 4.7GB | 12.9s | 45% |
Vollstaendige Benchmark-Ergebnisse
ollama pull Keyvan/german-ocr-turbo
ollama run Keyvan/german-ocr-turbo "Extrahiere den Text aus diesem Dokument" --image rechnung.png
from german_ocr import GermanOCR
# Turbo-Modell (Standard)
ocr = GermanOCR(model_name="german-ocr-turbo")
# Text extrahieren
text = ocr.extract("rechnung.png")
print(text)
# Verschiedene Ausgabeformate
text_md = ocr.extract("doc.png", output_format="markdown")
text_json = ocr.extract("doc.png", output_format="json")
text_html = ocr.extract("doc.png", output_format="html")
pip install german-ocr
Extrahiere den Text im Markdown-Format
Extrahiere den Text als JSON
Extrahiere den Text als HTML
Extrahiere den Text als reinen Text
Apache 2.0
Keyvan Hardani - keyvan.ai
Made with love in Germany