Wir haben heute eine Vielzahl an Dokumenten in das Archiv importiert – zuerst 200.000 und dann noch einmal 50.000 Dateien. Im zweiten Durchlauf machte die Funktion eine Pause, weil zu viele Wörter in der Warteliste standen. Warum tritt das bei der kleineren Anzahl von Dokumenten auf? Ist das problematisch und benötigen wir mehr Arbeitsspeicher im PC?
Arbeitsliste der Volltextindexierung
Das ist nicht problematisch. Mehr Arbeitsspeicher ist nur sinnvoll, wenn Sie täglich so umfangreiche Mengen importieren.
Der Import und die Indexierung werden in je einem eigenen Thread, wenn möglich auch auf einem eigenen Prozessorkern ausgeführt. Besonders bei mehrseitigen Dokumenten benötigt die Indexierung (das Schreiben der Wörter in die Datenbank) mehr Zeit als der Import und das Einlesen des Dokumententextes. Den Status kann man links unten am Fortschrittsbalken sehen. Die Indexierung läuft im Hintergrund, so dass Sie gleichzeitig weiterarbeiten können.
Nach dem ersten Durchlauf mit 200.000 Dokumenten waren vermutlich schon mehrere hunderttausend Wörter in der Liste. Durch den anschließenden Import weiterer 50.000 Dateien wurde die Schwelle überschritten und die Importfunktion pausiert. Auf einem modernen PC liegt dieser Wert bei ca. 1 Mio Wörter.
Beschleunigungs-Tipps, wenn Sie häufiger große Mengen importieren
- Im Menü den Punkt nicht markieren.
- Wenn die DMS-Software direkt auf dem Server ausgeführt wird, dann brauchen die Daten nicht über das Netzwerk übertragen werden.
- Verwendung der Enterprise-Version mit SQL-Datenbankserver.
- Die Volltextsuche des MS SQL-Servers verwenden. Die Indexierung findet dann innerhalb der Datenbanksoftware statt.
Eigenen Kommentar schreiben oder eine Rückfrage stellen