Aug
19
2011

OCR für Import erforderlich?

Kategorie: Importieren, OCR-Texterkennung
Support-Recherche: Importieren, Einstellungen


Ich plane für heute den Import unseres gesamten Dokumentenbestandes in das Office Manager-Archiv. Muss ich dafür eine OCR-Texterkennungssoftware installieren?

Grundsätzlich nicht

Eine Texterkennung ist nur beim Scannen von Papierdokumenten erforderlich. Die OCR-Software analysiert dabei die gescannten Bilder und erkennt den enthaltenen Dokumententext.

Beim Import von elektronischen Dokumenten, wie zum Beispiel Office-Dateien, ist kein OCR erforderlich. Die Dokumente beinhalten bereits Text, der vom Office Manager ausgelesen und für die Volltextsuche indexiert wird.

Import gescannter Dokumente

Falls Sie auch Dokumente importieren möchten, die früher gescannt wurden, dann prüfen Sie bitte, ob OCR erforderlich ist:

  • PDF-Dateien können Sie z.B. im Acrobat Reader öffnen. Klicken Sie dort im Menü Bearbeiten auf Alles markieren. Wenn der Text bereits erkannt ist, dann wird dieser markiert.
  • TIFF-Dateien beinhalten i.d.R. keinen Text. Es ist aber möglich, dass dieser in den Meta-Daten der TIFF gespeichert ist.

Empfohlenes Vorgehen

  • Blenden Sie die Spalte „Wortanzahl“ in der Dokumententabelle ein.
  • Importieren Sie alle Dokumente.
  • Sortieren Sie die Tabelle nach der Wortanzahl, Dokumente mit wenigen Wörtern stehen jetzt am Anfang. Wenige Wörter bedeutet, dass nur die Daten des Archives (Name, Projekt, Datei usw.) erfasst wurden, aber kein Dokumententext.
  • Prüfen Sie, ob es sich um gescannte Dokumente handelt. Zum Beispiel beinhalten Fotos keinen Text – eine OCR-Ausführung ist da nicht sinnvoll.

Wenn gescannte Dokumente vorliegen, für die OCR ausgeführt werden soll:

  • Installieren Sie die Office Manager-Funktionen für ein nachträgliches OCR.
  • Markieren Sie die betroffenen Dokumente. Achten Sie darauf, dass immer nur ein Dokumenttyp gewählt ist, also zum Beispiel nur Acrobat-PDF gleichzeitig markieren.
  • Wählen Sie im Menü Start | Verwenden | Befehle die zuvor installierte Funktion OCR im Hintergrund.

 

Noch keine Kommentare

Eigenen Kommentar schreiben oder eine Rückfrage stellen

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Sie können folgende HTML-Tags verwenden: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>