unsere Firma will für Demonstrationszwecke Daten aus unserem Produktiv-HCM-System in ein Demosystem migrieren. Ich soll eine kleine Präsentation machen, welche Möglichkeiten es über ABAP Routinen gäbe, die Daten bei Beladung so zu anonymisieren, dass sie natürlich keine Rückschlüsse mehr auf Personen zulassen, aber gleichzeitig sinnvoll auswertbar bleiben.
Ich dachte, evtl. die Daten in den betreffenden Merkmalen spaltenweise zu "durchmischen", weiß aber nicht ob das machbar ist oder ob es nicht vielleicht auch bessere Möglichkeiten gibt.
Hallo Toni,
vermutlich ist eine vernünftige Anonymisierung mit vertretbarem Aufwand nicht hinzubekommen.
Ev. ist es besser sich am Markt eine entsprechende Lösung zu kaufen.
vielleicht hat aber trotzdem jemand einen hinweis ( muss nicht mit code sein, sondern nur allgemeine herangehensweise ) wie man das hinbekommen könnte bzw wo eurer Meinung nach man am Besten ansetzen sollte?
Ich hatte mir das quasi als eine Art einmal rotierende Permutation vorgestellt, die beim Beladen des InfoObject durch die gepufferten Daten läuft. In etwa so:
Moin.
Mein Vorschlag:
Im HR sind die Personen bezogenen Daten NAME VORNAME ... in der Tabelle PA0002 abgelegt (also INFOTYP 0002 in der PA30) . Schlüsselfelder sind die Personalnummer / Gültigkeit etc....
Für eine Personal Testdaten Tabelle könnte man die PA0002 kopieren und bis auf Vor und Nachname eigentlich alles kopieren.
Vor und Nachname fülle ich einfach mit Daten aus dem Telefonbuch. Z.B.
lese ich von der Seite https://anrufer.info/telefonnummern/040-69794
jeweils 12 Nameneinträge und setze diese beim Füllen meiner ZPA0002 ein.
Dann permutiere ich die Telefonnummer in der URL und nehme die nächsten 12 Einträge ... usw..
So bleibt noch die Referenz zur Original Personalnummer.
Wenn man das nicht will, muß man zusätzlich für ZPA0002 halt neue Personalnummern "erfinden".
gruß Jens
<:: XING-Gruppe Tricktresor::> Die deutsche Rechtschreibung ist Freeware, du darfst sie kostenlos nutzen – Aber sie ist nicht Open Source, d. h. du darfst sie nicht verändern oder in veränderter Form veröffentlichen.
Da die Personalnummer das kritische Element sind - Schlüsselteil in allen Tabellen - darf gerade die Personalnummer nicht erhalten bleiben, d.h. die Daten der Tabellen müssen zwischen den Personalnummern durchgemischt werden. Und dann noch sinnvolle Daten - die nicht nur die Einfachstfälle beinhalten - sind eine nicht zu unterschätzende Herausforderung.
Danke schonmal für eure ganzen ausführlichen Überlegungen und Tipps. Ich weiß das sehr zu schätzen. Ich werd mich morgen mal ransetzen und nochmal alles genau durchgehen. Heute Abend ist erstmal 30. Geburtstag angesagt :) den Vorschlag von Tron finde ich ganz schlüssig, und auch der abapfaker sieht vielversprechend aus. Aber ich verstehe auf jeden Fall auch Thomas Einwand mit der Personalnummer. War auch mein Gedanke, dass in der Schlüsselfunktion der Personalnummer wahrscheinlich die große Herausforderung liegt.
Wir setzen dafür im HCM Umfeld die Komponente CTBAS "Accenture Clone and Test - Basis Module" ein.
Damit kann man die ganze HR Stammdaten auf ein anderes System/Mandant kopieren und auch gleich anonymisieren.
Die Personalnummer bleibt aber leider auch da bestehen. Es werden lediglich die Namen und so Sachen abgeändert.
okay, also die Personalnummer könnte man doch auch einfach mit einem Zufallswert mappen. Ich denke ein guter Ansatzpunkt sind evtl die HANA anonymisation features ( k-anonymity) plus dummy werte aus dem ABAP-faker für name etc.
Moin.
Wenn man die Personalnummern ändert, dann darf man nicht vergessen,
das bestehende Daten auch angepasst werden müssten.
Zum Beispiel die Partnerrollen (VBPA / IHPA /..) in Belegen und wo sonst noch die Personalnummer eingesetzt wird.
gruß Jens
<:: XING-Gruppe Tricktresor::> Die deutsche Rechtschreibung ist Freeware, du darfst sie kostenlos nutzen – Aber sie ist nicht Open Source, d. h. du darfst sie nicht verändern oder in veränderter Form veröffentlichen.