Når (geo)data går under cover

Session

Grunddatafortællinger

Abstract

Persondata er underlagt store restriktioner, som er til stor gavn for individets beskyttelse. Det medfører dog en række store udfordringer for dataanalytikere og andre, som ønsker at forstå data på et aggregeret niveau.

Anonymiseret dataudveksling gør det muligt at anvende restriktionsbelagte og følsomme data på tværs af områder. Potentialet i kombinerede data udnyttes, output er fuldt brugbart OG databeskyttelse af personoplysninger opretholdes.

Anonymiseringsmetoder har et stort potentiale i sammenhænge, hvor analyser på persondata er påkrævede, men af personer, som ikke har adgang til persondata. Det eliminerer behovet for at oplyse enkeltindivider om, at de indgår i en analyse, da de ikke bliver en identificerbar del af data.

Målgruppe

Der er tre målgrupper:

  1. Du arbejder med geodata og vil høre om, hvordan man maskerer data
  2. Du tager beslutninger ud fra data og vil se, hvordan man kan lave brugbare analyser på maskerede data
  3. Alle andre, som vil se, hvordan deres personlige data kan anvendes uden at blive kompromitteret

Yderligere uddybning af abstract

Persondata er underlagt store restriktioner, som er til stor gavn for individets beskyttelse. Det medfører dog en række store udfordringer for dataanalytikere og andre, som ønsker at forstå data (og altså ikke enkeltindivider).

Anonymiseret dataudveksling gør det muligt at anvende restriktionsbelagte og følsomme data på tværs af områder. Potentialet i kombinerede data udnyttes, output er fuldt brugbart OG databeskyttelse af personoplysninger opretholdes.

I en test case hos en udvalgt aktør har vi sammen med denne og Alexandra Instituttet anvendt metoden ”Differential Privacy”. Aktørens kundekategorier med bestemte karakteristika til særlige formål blev kortlagt og ved brug af statistisk matematik blev data fra en eller flere kilder, hvoraf nogle var persondata, anvendt i en anonymiserende scorefunktion, hvor udvalget af parametre og de enkeltes vægtning blev nøje fastlagt i forhold til det aktuelle formål med analysen. Anonymiteten blev sikret dels ved, at det er umuligt at sige hvilke parametre, der giver resultatet, og dels ved at tilføje randomiseret støj.

Denne og lignende metoder har et stort potentiale i sammenhænge, hvor analyser på persondata er påkrævede, men af personer, som ikke ellers har adgang til persondata. Det eliminerer behovet for at oplyse enkeltindivider om, at de indgår i en analyse, da de ikke bliver en identificerbar del af data.