Geanonimiseerde gegevens vallen buiten de GDPR
Dat klinkt aantrekkelijk: als je gegevens goed anonimiseert, zijn het geen persoonsgegevens meer en hoef je je niet aan de GDPR te houden. Maar er zit een addertje onder het gras. Echte anonimisering is moeilijker dan de meeste mensen denken.
Anonimisering vs. pseudonimisering
Dit onderscheid is cruciaal en wordt vaak door elkaar gehaald.
Pseudonimisering
Je vervangt identificerende gegevens door een code. Klantnummer 12345 in plaats van Jan de Vries. Maar ergens bestaat een tabel die klantnummer 12345 koppelt aan Jan de Vries. Zolang die koppeling bestaat, zijn het nog steeds persoonsgegevens.
Pseudonimisering is een goede beveiligingsmaatregel, maar het is geen anonimisering. De GDPR is nog steeds van toepassing.
Anonimisering
Je verwijdert of wijzigt gegevens zodanig dat het onmogelijk is om de persoon te heridentificeren, ook niet door gegevens te combineren met andere bronnen. Er is geen sleutel, geen koppeltabel, geen weg terug.
Geanonimiseerde gegevens vallen buiten de GDPR. Je mag ze bewaren en gebruiken zonder de beperkingen van de privacywetgeving.
Technieken voor anonimisering
Generalisatie
Vervang specifieke waarden door bredere categorieen. In plaats van “32 jaar” schrijf je “30-39 jaar”. In plaats van “Amsterdam” schrijf je “Noord-Holland”.
Onderdrukking
Verwijder bepaalde velden volledig uit de dataset. Geen naam, geen adres, geen geboortedatum.
Perturbatie
Voeg ruis toe aan de gegevens. Verander exacte waarden in een bereik of voeg willekeurige variatie toe, zodat individuele waarden niet meer kloppen maar statistische patronen intact blijven.
Aggregatie
Presenteer gegevens alleen als totalen of gemiddelden. “42 klanten uit Noord-Holland” in plaats van individuele records.
De valkuilen
Heridentificatie door combinatie
Zelfs als je namen en adressen verwijdert, kan een combinatie van leeftijd, postcode en beroep vaak leiden tot heridentificatie. Onderzoek toont aan dat met drie van zulke kenmerken meer dan 80% van de mensen uniek identificeerbaar is.
Kleine datasets
Hoe kleiner de dataset, hoe moeilijker anonimisering. Als je dataset maar 5 klanten uit een bepaalde stad bevat, is een “geanonimiseerd” record met de stad erin nog steeds herleidbaar.
De toets
Stel jezelf de vraag: kan iemand met toegang tot andere publieke of commerciele datasets de personen in mijn dataset heridentificeren? Als het antwoord ja is of misschien, dan is het niet echt geanonimiseerd.
Wanneer anonimiseren?
De meest voorkomende toepassing is het bewaren van gegevens voor analyse nadat de bewaartermijn is verlopen. In plaats van klantgegevens volledig te verwijderen, anonimiseer je ze en behoud je de statistische waarde.
Andere toepassingen:
- Testomgevingen - gebruik geanonimiseerde kopietjes van productiedata voor softwaretests
- Rapportages - deel trends en statistieken zonder individuele gegevens bloot te stellen
- Onderzoek - analyseer patronen zonder de privacy van individuen te schenden
GDPRWise helpt je om bewaartermijnen in te stellen en bij te houden welke gegevens je verwerkt en wanneer je ze moet verwijderen of anonimiseren.