Ich plane für heute den Import unseres gesamten Dokumentenbestandes in das Office Manager-Archiv. Muss ich dafür eine OCR-Texterkennungssoftware installieren?
Grundsätzlich nicht
Eine Texterkennung ist nur beim Scannen von Papierdokumenten erforderlich. Die OCR-Software analysiert dabei die gescannten Bilder und erkennt den enthaltenen Dokumententext.
Beim Import von elektronischen Dokumenten, wie zum Beispiel Office-Dateien, ist kein OCR erforderlich. Die Dokumente beinhalten bereits Text, der vom Office Manager ausgelesen und für die Volltextsuche indexiert wird.
Import gescannter Dokumente
Falls Sie auch Dokumente importieren möchten, die früher gescannt wurden, dann prüfen Sie bitte, ob OCR erforderlich ist:
- PDF-Dateien können Sie z. B. im Acrobat Reader öffnen. Klicken Sie dort im Menü auf . Wenn der Text bereits erkannt ist, dann wird dieser markiert.
- TIFF-Dateien beinhalten i. d. R. keinen Text. Es ist aber möglich, dass dieser in den Meta-Daten der TIFF gespeichert ist.
Empfohlenes Vorgehen
- Blenden Sie die Spalte „Wortanzahl“ in der Dokumententabelle ein.
- Importieren Sie alle Dokumente.
- Sortieren Sie die Tabelle nach der Wortanzahl, Dokumente mit wenigen Wörtern stehen jetzt am Anfang. Wenige Wörter bedeutet, dass nur die Daten des Archives (Name, Projekt, Datei usw.) erfasst wurden, aber kein Dokumententext.
- Prüfen Sie, ob es sich um gescannte Dokumente handelt. Zum Beispiel beinhalten Fotos keinen Text – eine OCR-Ausführung ist da nicht sinnvoll.
Wenn gescannte Dokumente vorliegen, für die OCR ausgeführt werden soll:
- Markieren Sie die betroffenen Dokumente.
- Wählen Sie im Menü die Funktion .
Eigenen Kommentar schreiben oder eine Rückfrage stellen