DMS Datenraum

Hotline Blog: Office Manager DMS

Dokumentenmanagement und digitale Archivierung

Mrz
21
2011

Dokument-Dubletten finden

Kategorie: Einstellungen
Support-Recherche: Kopie, Klon, SQL-Abfrage, Klone, Dubletten suchen


Wir haben bisher viel mit Kopien und Klonen gearbeitet, um einzelne Dokumente mehreren Projekten und Aufträgen zuzuordnen. Zukünftig möchten wir die s.g. Mehrfachzuordnung im Archiv verwenden. Gibt es eine Möglichkeit, alle Datensätze abzufragen, die mehrfach auf dieselbe Dokumentdatei verweisen?

A. Alle Dokumenten-Klone suchen

(Nur Office Manager Enterprise-Edition)

Blenden Sie dazu bitte zuerst das Datenfeld „Klon“ ein, falls es noch nicht in der Tabelle enthalten ist (Anleitung). Stellen Sie sicher, dass der Mausschalter Ansicht | Tabelle | Datensätze in Speicher laden gedrückt (farbig hervorgehoben) ist. Sortieren Sie die Dokumente absteigend über die Klon-Spalte, indem Sie zweimal auf den Tabellenkopf „Klon“ klicken. Alle Dokumentenklone befinden sich jetzt am Anfang der Tabelle.

B. Dokumente mit demselben Dateinamen suchen

Um alle Dubletten im Archiv zu finden, können Sie eine SQL-Abfrage ausführen. Diese findet auch mehrfach vorhandene Dateiverknüpfungen, die nicht als Klon erstellt wurden.

Melden Sie sich als Administrator an (Datei | Optionen | Administrator). Öffnen Sie bitte den SQL-Editor (Menü Administrator | Skripte | SQL-Abfrage | SQL-Editor) und geben Sie folgende Abfrage ein:

SELECT * FROM DOCUMENT
WHERE FILENAME IN
(SELECT FILENAME FROM DOCUMENT
GROUP BY FILENAME HAVING count(FILENAME) > 1)

Klicken Sie bitte auf Abfrage | Ausführen und sortieren Sie die Tabelle nach Dateiname.

C. Inhaltsgleiche Dokumente suchen

Office Manager ab Version 12.0 ermittelt eine Hash-Summe der Dokumentdatei und speichert diese im Archivdatenfeld FILEHASHMD5.

In der Version 13.0 verwenden Sie bitte den Menübefehl Datei | Datenbank | Pflege | Dubletten suchen.

In 12.0 können Sie folgende SQL-Abfrage nutzen, um Dokumente mit identischer Hash-Summe zu suchen:

SELECT * FROM DOCUMENT
WHERE FileHashMD5 IN
(SELECT FileHashMD5 FROM DOCUMENT
GROUP BY FileHashMD5 HAVING count(FileHashMD5) > 1)

Beachten Sie aber, dass auch unterschiedliche Dateien die gleiche Hashsumme haben können.

Siehe auch

Archivabfragen mit SQL
Dokument-Mehrfachzuordnung
Vor Import prüfen, ob die Datei bereits im Archiv ist




Noch keine Kommentare

Eigenen Kommentar schreiben oder eine Rückfrage stellen

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Sie können folgende HTML-Tags verwenden: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>