4 min læsning

The GDPR compliant data warehouse | Part 2

Featured Image

Så er vi klar med del 2 af 4 om "GDPR compliant data warehouse". I denne del sætter vi fokus på, hvordan du vurderer data og ikke mindst håndterer sikkerhedsniveau. Du får også et eksempel på et standardiseret sikkerhedssetup, som du med fordel kan læse, hvis du anvender predictive analytics-data i et data warehouse. 

Hvis du ikke fik læst del 1, finder du den her

2 / Sådan vurderer du data og håndterer sikkerhedsniveau

Vurder behandling af persondata

For at vurdere det nødvendige sikkerhedsniveau skal du som dataansvarlig se på:

  • Hvilken type persondata du behandler
  • Hvordan det bliver behandlet
  • Hvorfor dette persondata bliver behandlet, altså formålet

Kategorier af persondata

Persondata er information, som relaterer sig til en bestemt person eller en identificerbar person. 

Følsomme persondata er information af personlig karakter, som fortæller om eksempelvis etnicitet, politisk overbevisning, religion, filosofisk overbevisning eller medlemskab i fagforening. Andre eksempler er genetisk data, biometrisk data som har til formål at identificere en unik person, helbredsdata eller data om en persons sexliv eller seksuelle orientering.

Hvilke typer persondata behandler du?

Hvis du behandler personfølsomme data, skal du sørge for et højere sikkerhedsniveau end ved almindelige data. Hvis en database eksempelvis indeholder data om, hvorfor en medarbejder har sygefravær, er det personfølsomt og dermed en grund til et højere sikkerhedsniveau.

Hvordan behandler du persondata? 

Tommelfingerreglen er, at jo større truslen er mod en persons privatliv, desto højere sikkerhedsniveau. Du skal derfor behandle data forskelligt, hvad end det skal opbevares i et data warehouse, fordi det fx skal bruges i et dashboard, eller det skal bruges til profiling via machine learning. Machine learning kan nemlig afsløre følsomme informationer om en specifik person.

Med hvilket formål behandler du persondata?

Data kan bruges til profilering til fx at udregne forsikringspræmie for en person, som vil tegne en ny forsikring. Formålet kunne også være administration af medarbejdere. Igen – jo større indflydelse det har på en persons privatliv, jo højere sikkerhedsniveau.

Sådan håndterer du sikkerhed

Når du har vurderet formålet med data og de forskellige typer data, kan du som dataansvarlig fastlægge det rette sikkerhedsniveau. Data warehouse-arkitekten kan nu designe et setup og en løsning, som sikrer både formålet og det nødvendige sikkerhedsniveau.

Arkitekten kan nu vurdere, om data skal krypteres, når det gemmes eller når det overføres. En anden vurdering kunne være, om persondata skal anonymiseres eller være under pseudonym – uden at miste formålet med data. 

Eksempler på et standardiseret sikkerhedssetup

Forestil dig en medievirksomhed, som sælger artikler online. De har brugere, som logger ind på deres website for at læse artikler, og vi kan jo kalde en tilfældig bruger for Zark Muckerberg. Hver gang Zark læser en artikel, vil medievirksomheden gerne, at han bliver på deres website, og de tilbyder ham derfor kontinuerligt nye artikler, så Zark bliver på sitet. Dermed kan medievirksomheden tjene flere penge på annoncerne på websitet. 

Som en hjælp til dette arbejde har data warehouse-arkitekten lavet en anbefalingsmotor, som gennem machine learning forudsiger hvilke artikler, Zark gerne vil læse som den næste. Selvom Zark ikke går særlig meget op i han privatlivsindstillinger, vil avisen gerne sørge for hans sikkerhed gennem et styrket sikkerhedsniveau.

Forestil dig følgende tre dataser – og hold tungen lige i munden:

  • Anbefalingsdatabase med en nummeret nøgle på læste artikler og et machine learning script
  • Logindatabase med alle logininformationer
  • Artikeldatabase med indholdsnøgler og cookies fra browserdata samt hvilke artikler, der er blevet læst

Logindatabasen indeholder alle informationer. Disse informationer behøver ikke nødvendigvis at forlade logindatabasen. Lav en gruppering i active directory, så det kun er administratorer, som har adgang til logindatabasen. Login-information om brugere skal have et pseudonym, som i dette tilfælde vil være et trace_ID. Dette trace_ID bliver brugt i både anbefalings- og artikeldatabasen. På den måde vil brugere med adgang til data warehouse ikke have adgang til persondata om Zark Muckerberg eller andre brugere, da de kun kan se deres trace_ID.

gppr_trace_id

Der er mange overvejelser omkring sikkerhed. Og disse kan du glæde dig til at læse om i næste afsnit. 

Vil du vide mere nu?
Hvis du har spørgsmål eller søger kompetent rådgivning og konsulentbistand omkring data warehouse, så tøv ikke med at kontakte os på info@inspari.dk / +45 70 24 56 55. Du kan også læse mere om data warehouse og den moderne BI-platform lige her: Den moderne BI-platform.

The GDPR Compliant Data Warehouse #1
The GDPR Compliant Data Warehouse #2
The GDPR Compliant Data Warehouse #3
The GDPR Compliant Data Warehouse #4