DMS Datenraum

Hotline Blog: Office Manager DMS

Dokumentenmanagement und digitale Archivierung

Apr
07
2011

Warteliste bei Volltextindexierung

Kategorie: Importieren
Support-Recherche: Einstellungen


Wir haben heute eine Vielzahl an Dokumenten in das Archiv importiert – zuerst 200.000 und dann noch einmal 50.000 Dateien. Im zweiten Durchlauf machte die Funktion eine Pause, weil zu viele Wörter in der Warteliste standen. Warum tritt das bei der kleineren Anzahl von Dokumenten auf? Ist das problematisch und benötigen wir mehr Arbeitsspeicher im PC?

Arbeitsliste der Volltextindexierung

Das ist nicht problematisch. Mehr Arbeitsspeicher ist nur sinnvoll, wenn Sie täglich so umfangreiche Mengen importieren.

Screenshot: Viele Wörter in Warteliste

Der Import und die Indexierung werden in je einem eigenen Thread, wenn möglich auch auf einem eigenen Prozessorkern ausgeführt. Besonders bei mehrseitigen Dokumenten benötigt die Indexierung (das Schreiben der Wörter in die Datenbank) mehr Zeit als der Import und das Einlesen des Dokumententextes. Den Status kann man links unten am Fortschrittsbalken sehen. Die Indexierung läuft im Hintergrund, so dass Sie gleichzeitig weiterarbeiten können.

Nach dem ersten Durchlauf mit 200.000 Dokumenten waren vermutlich schon mehrere hunderttausend Wörter in der Liste. Durch den anschließenden Import weiterer 50.000 Dateien wurde die Schwelle überschritten und die Importfunktion pausiert. Auf einem modernen PC liegt dieser Wert bei ca. 1 Mio Wörter.

Beschleunigungs-Tipps, wenn Sie häufiger große Mengen importieren

  • Im Menü Ansicht | Tabelle den Punkt Datensätze in den Speicher laden nicht markieren.
  • Wenn die DMS-Software direkt auf dem Server ausgeführt wird, dann brauchen die Daten nicht über das Netzwerk übertragen werden.
  • Verwendung der Enterprise-Version mit SQL-Datenbankserver.
  • Die Volltextsuche des MS SQL-Servers verwenden. Die Indexierung findet dann innerhalb der Datenbanksoftware statt.



Noch keine Kommentare

Eigenen Kommentar schreiben oder eine Rückfrage stellen

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Sie können folgende HTML-Tags verwenden: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>