Dubletten

Getting started ... Alles für einen gelungenen Start.
9 Beiträge • Seite 1 von 1
9 Beiträge Seite 1 von 1

Dubletten

Beitrag von greenhorn (ForumUser / 5 / 0 / 0 ) »
Hallo zusammen,

da eine Dublettenüberprüfung für technische Objekte in CRM nicht standardmäßig enthalten ist, muss diese implementiert werden.
Dabei überprüfe ich, ob die eingegebenen Werte des Users bereits in der DB enthalten sind und gebe -falls jene vorhanden- eine Fehlernachricht aus.
Dabei muss ich eine Logik implementieren die es mir ermöglicht folgende Szenarien zu meistern:

Usereingabe: Feld1: Schönlein strasse 5a
DB: Feld1:Schoenleinstraße, Feld2: 5, Feld3: a

Wie kann ich das abfangen und als Dublette erkennen?

Vielen Dank im Voraus.

greenhorn

gesponsert
Stellenangebote auf ABAPforum.com schalten
kostenfrei für Ausbildungsberufe und Werksstudenten


Re: Dubletten

Beitrag von Spookykid (Specialist / 140 / 28 / 0 ) »
Hallo,

ich bin zwar kein Doubletten-Profi, ich denke aber nicht, dass du das mit ein paar Zeilen ABAP lösen kannst.

Garbage IN = Garbage OUT.

Man muss das Problem bei der Wurzel packen und das ist halt die Eingabe der Stammdaten im CRM.

Wenn es bei deiner Prüfung nur um Adressdaten geht, würd' ich mir mal die Plugins dieses Anbieters anschauen.
http://www.addressdoctor.com/de/default.asp

Re: Dubletten

Beitrag von ralf.wenzel (Top Expert / 3776 / 176 / 262 ) »
greenhorn hat geschrieben:Usereingabe: Feld1: Schönlein strasse 5a
DB: Feld1:Schoenleinstraße, Feld2: 5, Feld3: a

Wie kann ich das abfangen und als Dublette erkennen?
Mit entsprechendem Coding, das vergleichbares (oe / ö, etc.) vergleicht. ;) Hab ich schon gemacht, war witzig.


Ralf
Bild
Ralf Wenzel Heuristika SAP-Development
25 Jahre SAP-Entwickler • 20 Jahre Freiberufler
PublikationenUngarische NotationXing

Re: Dubletten

Beitrag von black_adept (Top Expert / 3943 / 105 / 886 ) »
Nett wird es auch, wenn man "Straße" , "Strasse" und "Str." auch noch als gleich erkennen möchte.
Oder wenn "Schönleinstraße" gleichzusetzten ist mit einem minimalen Schreibfehler wie "Schönlienstraße".

Habe so was ähnliches vor Jahren mal gemacht als Datenbereinigung - aber wir sind dann von "Gleichheit" weg gegangen und haben uns auf "Ähnlichkeit" geeinigt.
Haben Adressdaten verglichen und aus 2 Adresssätzen einen "Ähnlichkeitsfaktor" bestimmt. Und alle Datensätze die "ähnlich genug" waren wurden dann nochmal visuell überprüft, ob das tatsächlich dieselbe Adresse ist.
live long and prosper
Stefan Schmöcker

email: stefan@schmoecker.de

Re: Dubletten

Beitrag von greenhorn (ForumUser / 5 / 0 / 0 ) »
str., straße, strasse...das problem hab ich gelöst, indem ich alles was mit 'str' beginnt abschneidet und mit "STR*" ersetzt.

Erkennt. des Tages: Das Problem kann nicht zu 100% automatisiert werden. Was dem sehr nahe kommt ist der "Levensthein"-Algo. Eine Implementierung dessen würde jedoch eine Nutzen/Aufwand-Analyse nicht standhalten.
-g.

Re: Dubletten

Beitrag von ralf.wenzel (Top Expert / 3776 / 176 / 262 ) »
greenhorn hat geschrieben:str., straße, strasse...das problem hab ich gelöst, indem ich alles was mit 'str' beginnt abschneidet und mit "STR*" ersetzt.
Du hast das Problem damit umgangen, aber keinesfalls gelöst.... Etliche Straßennamen sind nach Personen benannt - mir fällt eine ehem. Mitschülerin ein, die "Stricker" heißt.... Heraus kommt ein sehr komplexer Algorithmus, der dann immer noch nicht alle Fälle "erschlagen" kann, wie du schon sagst: Das Problem ist nicht rein maschinell lösbar.
Bild
Ralf Wenzel Heuristika SAP-Development
25 Jahre SAP-Entwickler • 20 Jahre Freiberufler
PublikationenUngarische NotationXing

Re: Dubletten

Beitrag von greenhorn (ForumUser / 5 / 0 / 0 ) »
teillösung:

replace "str." with "str%"
replace "straße" "str%"
replace "strasse" "str%"

das wäre die richtige richtung. nur blöd bei z.B. "mainzer landstraße" -> "mainer landstr*"
immerhin wird die straße "gefunden"...

Re: Dubletten

Beitrag von black_adept (Top Expert / 3943 / 105 / 886 ) »
greenhorn hat geschrieben:Was dem sehr nahe kommt ist der "Levensthein"-Algo. Eine Implementierung dessen würde jedoch eine Nutzen/Aufwand-Analyse nicht standhalten.
-g.
Wie kommst du darauf, dass SAP so etwas nicht hätte?
http://www.abapforum.com/forum/viewtopi ... 15&p=50116
live long and prosper
Stefan Schmöcker

email: stefan@schmoecker.de

Re: Dubletten

Beitrag von Tron (Top Expert / 1327 / 35 / 331 ) »
Moin,
hier eine gute Quelle zum Lenvenshtein-Algo (auch in ABAP):
http://en.wikibooks.org/wiki/Algorithm_ ... n_distance
gruß Jens
<:: XING-Gruppe Tricktresor::>
Die deutsche Rechtschreibung ist Freeware, du darfst sie kostenlos nutzen –
Aber sie ist nicht Open Source, d. h. du darfst sie nicht verändern oder in veränderter Form veröffentlichen.

Seite 1 von 1

Vergleichbare Themen

2
Antw.
1301
Views
Dubletten
von bohne » 07.12.2006 23:24 • Verfasst in ABAP® für Anfänger
2
Antw.
2495
Views
Dubletten Bereinigung
von zeico » 10.11.2008 20:36 • Verfasst in Sales and Distribution
16
Antw.
2841
Views
Dubletten herausfinden
von L0w-RiDer » 14.03.2019 08:45 • Verfasst in ABAP® für Anfänger

Newsletter Anmeldung

Keine Beiträge verpassen! Wöchentlich versenden wir lesenwerte Beiträge aus unserer Community.
Die letzte Ausgabe findest du hier.
Details zum Versandverfahren und zu Ihren Widerrufsmöglichkeiten findest du in unserer Datenschutzerklärung.

Unbeantwortete Forenbeiträge

Zwischensumme Adobe Forms
vor 4 Tagen von Lucyalison 1 / 71
Group Items auf einer Filterbar
vor einer Woche von Bright4.5 1 / 111
tRFC Transaktionen SM58
vor 4 Wochen von A6272 1 / 141