Skip Navigation LinksFunktionen > Dubletten > Dublettenbereinigung mit Verschmelzung

Keywords: Adressqualität, Datenqualität, Data Quality, Adressen, Adressdatenbank, CRM, Dubletten, Dublettenprüfung, Dublettenbereinigung, Verschmelzung, Software.

Verschmelzung

Es wird leicht übersehen, dass es nicht reicht, Dubletten zu finden. Die Dublettenadressen müssen auch bereinigt werden.

Beispiel:

Nr   

Titel     

Vorname           

Name          

Telefon

1


Hans

Maier

+49 89 811 331

2

Dr.


Maier

+49 89 811 442

Ergebnis bei Selektion von Satz 1:



Hans

Maier

+49 89 811 331

Ergebnis bei Selektion von Satz 2:

 

Dr.


Maier

+49 89 811 442

Ergebnis bei Verschmelzung von Satz 1 und 2:


Dr.

Hans

Maier

+49 89 811 331, +49 89 811 442

Das klassische Verfahren ist die Selektion: Es wird eine Adresse ausgewählt, die überlebt, und die übrigen Adressen werden eliminiert. Bei der Auswahl kann man zwar gewisse Prioritäten festlegen, also etwa die Adressen aus einer bestimmten Datei oder die Adresse mit dem jüngsten Änderungsdatum bevorzugen. Auf jeden Fall gehen aber die Informationen aus den eliminierten Adressen unter.

Selbst bei einfachen Anwendungen wie der Vorbereitung eines Mailings führt die Selektion zu unbefriedigenden Ergebnissen. Hat man etwa zwei Dubletten, eine mit dem Titel und die anderen mit dem Vornamen (also zum Beispiel „Dr. Maier“ und „Hans Maier“), dann überlebt bei der Selektion entweder der „Dr. Maier“ oder der „Hans Maier“. Die erwünschte Vervollständigung zu „Dr. Hans Maier“ kann nur die Verschmelzung leisten. Deswegen empfiehlt sich, die Verschmelzung auch bei so einfachen Aufgabenstellungen wie der Dublettenbereinigung für ein Mailing einzusetzen.

q.address lässt komplexe Verschmelzungsregeln zu: zum Beispiel die Auswahl eines Vornamens aus einer bevorzugten Datei (wenn mehrere Dateien unterschiedliche Prioritäten haben) und innerhalb derselben Datei der Vorname aus der Adresse mit dem jüngsten Änderungsdatum. (Siehe Abbildung 1)

Wichtig ist auch die Möglichkeit der Konkatenierung. Enthalten verschiedene Dublettenadressen verschiedene Telefonnummern, möchte man gerne alle Telefonnummern erhalten. Mit Hilfe der Konkatenierung werden alle Telefonnummern in den Ergebnissatz übernommen. (Siehe Abbildung 2)

Abbildung 1 – Verschmelzungsregel für der Vornamen: Die Anweisung ist von rechts nach links zu lesen. Zunächst werden alle vorhandenen Vornamen ausgewählt (nonempty). Aus diesen werden jene ausgewählt, die zu der Datei mit der höchsten Dateipriorität gehören (maxfileprio). Unter den verbleibenden Vornamen wird nun der Vorname zum jüngsten Änderungsdatum ausgewählt (maxaddressprio).
Abbildung 2 – Verschmelzungsregel für die Telefonnummer: Es werden alle vorhandenen, eindeutigen Telefonnummern ausgewählt (nonempty) und aneinandergehängt. Die Nummern werden dabei jeweils durch ein Semikolon getrennt (concatunique).

Beachten Sie in Abbildung 1 und 2 die zahlreichen weiteren möglichen Verschmelzungsfunktionen!

Produkte

Die Verschmelzung (bei der Bereinigung von Adressdateien) ist verfügbar in:

q.address Stand-alone

ACS Informatik GmbH
Landsberger Straße 398
81241 München
Germany

Tel: +49 (0)89 820 755-20
sales@qaddress.de
www.qaddress.de