Dubletten

Getting started ... Alles für einen gelungenen Start.
9 Beiträge Seite 1 von 1
9 Beiträge Seite 1 von 1

Dubletten

Beitrag von greenhorn (ForumUser / 5 / 0 / 0 ) » 20. Jul 2011 12:01

Hallo zusammen,

da eine Dublettenüberprüfung für technische Objekte in CRM nicht standardmäßig enthalten ist, muss diese implementiert werden.
Dabei überprüfe ich, ob die eingegebenen Werte des Users bereits in der DB enthalten sind und gebe -falls jene vorhanden- eine Fehlernachricht aus.
Dabei muss ich eine Logik implementieren die es mir ermöglicht folgende Szenarien zu meistern:

Usereingabe: Feld1: Schönlein strasse 5a
DB: Feld1:Schoenleinstraße, Feld2: 5, Feld3: a

Wie kann ich das abfangen und als Dublette erkennen?

Vielen Dank im Voraus.

greenhorn


Re: Dubletten

Beitrag von Spookykid (Specialist / 140 / 28 / 0 ) » 20. Jul 2011 13:48

Hallo,

ich bin zwar kein Doubletten-Profi, ich denke aber nicht, dass du das mit ein paar Zeilen ABAP lösen kannst.

Garbage IN = Garbage OUT.

Man muss das Problem bei der Wurzel packen und das ist halt die Eingabe der Stammdaten im CRM.

Wenn es bei deiner Prüfung nur um Adressdaten geht, würd' ich mir mal die Plugins dieses Anbieters anschauen.
http://www.addressdoctor.com/de/default.asp

Re: Dubletten

Beitrag von ralf.wenzel (Top Expert / 3399 / 147 / 218 ) » 20. Jul 2011 14:01

greenhorn hat geschrieben:Usereingabe: Feld1: Schönlein strasse 5a
DB: Feld1:Schoenleinstraße, Feld2: 5, Feld3: a

Wie kann ich das abfangen und als Dublette erkennen?
Mit entsprechendem Coding, das vergleichbares (oe / ö, etc.) vergleicht. ;) Hab ich schon gemacht, war witzig.


Ralf

Re: Dubletten

Beitrag von black_adept (Top Expert / 3234 / 54 / 563 ) » 20. Jul 2011 15:38

Nett wird es auch, wenn man "Straße" , "Strasse" und "Str." auch noch als gleich erkennen möchte.
Oder wenn "Schönleinstraße" gleichzusetzten ist mit einem minimalen Schreibfehler wie "Schönlienstraße".

Habe so was ähnliches vor Jahren mal gemacht als Datenbereinigung - aber wir sind dann von "Gleichheit" weg gegangen und haben uns auf "Ähnlichkeit" geeinigt.
Haben Adressdaten verglichen und aus 2 Adresssätzen einen "Ähnlichkeitsfaktor" bestimmt. Und alle Datensätze die "ähnlich genug" waren wurden dann nochmal visuell überprüft, ob das tatsächlich dieselbe Adresse ist.
live long and prosper
Stefan Schmöcker

email: stefan@schmoecker.de

Re: Dubletten

Beitrag von greenhorn (ForumUser / 5 / 0 / 0 ) » 21. Jul 2011 13:28

str., straße, strasse...das problem hab ich gelöst, indem ich alles was mit 'str' beginnt abschneidet und mit "STR*" ersetzt.

Erkennt. des Tages: Das Problem kann nicht zu 100% automatisiert werden. Was dem sehr nahe kommt ist der "Levensthein"-Algo. Eine Implementierung dessen würde jedoch eine Nutzen/Aufwand-Analyse nicht standhalten.
-g.

Re: Dubletten

Beitrag von ralf.wenzel (Top Expert / 3399 / 147 / 218 ) » 21. Jul 2011 13:39

greenhorn hat geschrieben:str., straße, strasse...das problem hab ich gelöst, indem ich alles was mit 'str' beginnt abschneidet und mit "STR*" ersetzt.
Du hast das Problem damit umgangen, aber keinesfalls gelöst.... Etliche Straßennamen sind nach Personen benannt - mir fällt eine ehem. Mitschülerin ein, die "Stricker" heißt.... Heraus kommt ein sehr komplexer Algorithmus, der dann immer noch nicht alle Fälle "erschlagen" kann, wie du schon sagst: Das Problem ist nicht rein maschinell lösbar.

Re: Dubletten

Beitrag von greenhorn (ForumUser / 5 / 0 / 0 ) » 21. Jul 2011 17:17

teillösung:

replace "str." with "str%"
replace "straße" "str%"
replace "strasse" "str%"

das wäre die richtige richtung. nur blöd bei z.B. "mainzer landstraße" -> "mainer landstr*"
immerhin wird die straße "gefunden"...

Re: Dubletten

Beitrag von black_adept (Top Expert / 3234 / 54 / 563 ) » 22. Jul 2011 09:47

greenhorn hat geschrieben:Was dem sehr nahe kommt ist der "Levensthein"-Algo. Eine Implementierung dessen würde jedoch eine Nutzen/Aufwand-Analyse nicht standhalten.
-g.
Wie kommst du darauf, dass SAP so etwas nicht hätte?
http://www.abapforum.com/forum/viewtopi ... 15&p=50116
live long and prosper
Stefan Schmöcker

email: stefan@schmoecker.de

Re: Dubletten

Beitrag von Tron (Top Expert / 1000 / 8 / 200 ) » 25. Jul 2011 10:03

Moin,
hier eine gute Quelle zum Lenvenshtein-Algo (auch in ABAP):
http://en.wikibooks.org/wiki/Algorithm_ ... n_distance
gruß Jens
<:: XING-Gruppe Tricktresor::>
Die deutsche Rechtschreibung ist Freeware, du darfst sie kostenlos nutzen –
Aber sie ist nicht Open Source, d. h. du darfst sie nicht verändern oder in veränderter Form veröffentlichen.

Seite 1 von 1

Aktuelle Forenbeiträge

Meldungsnr. TK332 nur in lokalen Aufträgen bearbeiten
vor 2 Stunden von autohandel7 5 / 38
FuBa Datum -> Quartal
vor 2 Stunden von il.ost 3 / 39
ABAP Clean Code
vor 20 Stunden von ralf.wenzel 48 / 1120
Userexit vor dem Transport-import
vor 21 Stunden von A6272 7 / 184

Unbeantwortete Forenbeiträge

Kundenhierarchien in der Preisfindung
Gestern von SAP_ENTWICKLER 1 / 31
[GELÖST] Feld KNVV-BOIDT
vor 6 Tagen von SAP_ENTWICKLER 1 / 60
Sortierbegriffe einer Stückliste ändern
vor einer Woche von mbiesenb 1 / 46
Feiertagsklasse und Lohnart Verknüpfung entfernen
vor einer Woche von Flashtie 1 / 46