DMS Datenraum

Hotline Blog: Office Manager DMS

Dokumentenmanagement und digitale Archivierung

Jul
13
2011

Unterschiedliche Anzahl der gezählten Wörter

Kategorie: Archiv-Strukturen
Support-Recherche: Info Volltextindex


Ich habe das Datenfeld ‚Wörter‘ in der Tabelle eingeblendet – dieses gibt laut Dokumentation die Anzahle der Wörter eines Dokumentes an. Wenn ich mir die Volltext-Info anschaue, dann sind dort aber deutlich weniger Wörter angegeben. Welcher Wert ist der korrekte?
Beide Werte sind korrekt, sie haben unterschiedliche Bedeutungen:

  • Die dateiabhängige Spalte „Wörter“ in der Archivtabelle beinhaltet die Wort-Anzahl der Dokumentdatei.
  • Die Info Volltextindex im Menü Administrator enthält die Anzahl der Wörter im Datenbankindex.

Die Anzahl der indexierten Wörter ist geringer. Das liegt zum einen daran, dass nicht alle Wörter für die Volltextsuche indiziert werden. Die Liste der zu ignorierenden Wörter (Black list) beinhaltet häufig vorkommende und für die Suche uninteressante Wörter, beispielsweise „der“, „die“ und „das“. Diese Liste können Sie bei Bedarf an Ihre eigenen Anforderungen anpassen.

Zum anderen werden mehrfach vorkommende Wörter nur einmal gezählt.

Die Anzahl der indexierten Wörter kann also deutlich geringer sein, als die Anzahl der in der Datei enthaltenen.




Noch keine Kommentare

Eigenen Kommentar schreiben oder eine Rückfrage stellen

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Sie können folgende HTML-Tags verwenden: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>