Ich verwende Office Manager DMS vor allem für die Archivierung von Papierdokumenten. Reicht die mitgelieferte OCR-Software aus oder soll ich eine kommerzielle Lösung hinzukaufen?
Tesseract ist eine Open-Source-Software, die im Installationspaket von Office Manager DMS enthalten ist. Die OCR „Windows RT“ ist ab Windows 10 im Betriebssystem integriert. Diese beiden Programme stehen somit immer zur Verfügung.
Die Erkennungsergebnisse sind i. d. R. gut, aber stark von der Scan-Qualität abhängig. Flecken oder Raster hinter dem Text führen zu schlechten Ergebnissen. Bei Verwendung als reine Zeichenerkennung ohne Wörterbuch und Training kommt es beispielsweise zu klassischen Verwechselungen zwischen 0 und O, i und l.
Wenn Sie viel scannen und die Volltextsuche im Archivierungsprogramm verwenden, dann sollten Sie den Kauf einer kommerziellen OCR-Software in Betracht ziehen. Sie können zusätzlich zu Tesseract und der OCR von Windows folgende Programme verwenden:
- Nuance OmniPage
- ABBYY FineReader for ScanSnap
- ABBYY FineReader Corporate mit HotFolder-Funktion
- ReadIRIS mit überwachtem Ordner
- Transym OCR
- MODI (nur im 32 Bit Office Manager)
Falls Sie einen Fujitsu/Ricoh ScanSnap für die Archivierung verwenden, dann installieren Sie bitte auch den beiliegenden ABBYY FineReader und aktivieren Sie diesen im DMS. Wenn Sie noch keine passende OCR haben, dann empfehlen wir den Kauf von OmniPage. Es muss auch nicht unbedingt die neueste Version sein, wir haben OmniPage ab 16.0 mit Office Manager DMS getestet.
Siehe auch
Test von OCR-Programmen für die Archivierung
OCR-Einstellungen im DMS
Tesseract Diskussionsforum

Wir haben den Test im Januar 2024 mit aktueller OCR-Software wiederholt.