PII & Databeskyttelse Ordbog
Klare definitioner af nøglebegreber inden for privatliv, overholdelse og databeskyttelse anvendt i branchen.
Privatlivs- & Overholdelsesbegreber
Personligt Identificerbare Oplysninger (PII)
Enhver data, der kan identificere en specifik person, såsom navne, e-mailadresser, CPR-numre eller telefonnumre.
Anonymisering
Den irreversible proces at ændre data, så individer ikke kan identificeres, direkte eller indirekte.
Pseudonymisering
Erstatning af identificerbare data med kunstige identifikatorer (pseudonymer), så re-identifikation kræver en separat opbevaret nøgle.
De-identifikation
Fjernelse eller sløring af personlige identifikatorer fra data, så de ikke længere kan knyttes til en specifik person uden yderligere information.
Dataemne
En identificeret eller identificerbar fysisk person, hvis personoplysninger behandles af en dataansvarlig eller databehandler.
Dataansvarlig
Den enhed, der bestemmer formålene og midlerne til behandling af personoplysninger.
Databehandler
En enhed, der behandler personoplysninger på vegne af en dataansvarlig, i overensstemmelse med dataansvarliges instrukser.
Samtykke
En frit givet, specifik, informeret og entydig indikation af et dataemnes enighed til behandlingen af deres personoplysninger.
Lovligt Grundlag
Et juridisk grundlag, hvorunder behandling af personoplysninger er tilladt, såsom samtykke, kontraktmæssig nødvendighed, juridisk forpligtelse eller legitim interesse.
Dataminimering
Princippet om, at de personoplysninger, der indsamles, skal være tilstrækkelige, relevante og begrænset til, hvad der er nødvendigt for det tilsigtede formål.
Ret til Sletning
Et dataemnes ret til at få deres personoplysninger slettet, når de ikke længere er nødvendige, også kendt som 'retten til at blive glemt' under GDPR.
Dataportabilitet
Retten for dataemner til at modtage deres personoplysninger i et struktureret, almindeligt anvendt format og til at overføre dem til en anden dataansvarlig.
Databeskyttelsesansvarlig (DPO)
En udpeget person, der er ansvarlig for at overvåge en organisations databeskyttelsesstrategi og sikre overholdelse af privatlivsregler.
Databeskyttelseseffektvurdering (DPIA)
En proces til at identificere og minimere databeskyttelsesrisici ved et projekt, krævet under GDPR for højrisikobehandlingsaktiviteter.
Databrud
En sikkerhedshændelse, hvor personoplysninger tilgås, offentliggøres, ændres eller destrueres uden autorisation.
Shadow AI
Uautoriseret brug af AI-værktøjer (ChatGPT, Copilot, Gemini) af medarbejdere uden IT-godkendelse. Shadow AI er en førende årsag til PII-datalæk, da brugere indsætter følsomme forretningsdata – kunderegistre, patientoplysninger, økonomiske data – direkte i AI-prompter.
Dataminimering
Et GDPR-princip (Art. 5(1)(c)), der kræver, at organisationer kun indsamler og behandler det minimum af personoplysninger, der er nødvendige til et specifikt formål. I AI-systemer betyder dataminimering anonymisering eller fjernelse af PII, før data kommer ind i AI-pipelines, hvilket reducerer overholdelsesrisiko og brudflade.
Regulatoriske Rammer
GDPR (Generel Databeskyttelsesforordning)
EU-forordningen, der regulerer behandlingen af personoplysninger for enkeltpersoner inden for Det Europæiske Økonomiske Samarbejdsområde, gældende siden maj 2018.
CCPA (California Consumer Privacy Act)
En californisk lov, der giver forbrugere rettigheder over deres personlige oplysninger indsamlet af virksomheder, gældende siden januar 2020.
HIPAA (Health Insurance Portability and Accountability Act)
En amerikansk føderal lov, der fastsætter standarder for beskyttelse af følsomme patientoplysninger mod offentliggørelse uden samtykke.
ISO 27001
En international standard for informationssikkerhedsledelsessystemer (ISMS), der specificerer krav til etablering, implementering og løbende forbedring af sikkerhedskontroller.
SOC 2 (System and Organization Controls 2)
Et revisionsrammeværk for serviceorganisationer, der vurderer kontroller relateret til sikkerhed, tilgængelighed, behandlingsintegritet, fortrolighed og privatliv.
EU AI Act
EU-forordning om kunstig intelligens (håndhævet fra august 2026). Højrisiko AI-systemer skal implementere datastyringsforanstaltninger, herunder persondataminimering, dokumentation og DPIA. Organisationer, der bruger AI til beslutningstagning om enkeltpersoner, skal sikre, at træningsdata er anonymiserede eller pseudonymiserede.
ISO 42001
International standard for AI Management Systems (AIMS), udgivet i 2023. Giver en ramme for ansvarlig AI-udvikling og -implementering, herunder datakvalitet, bias-kontroller og beskyttelse af privatlivets fred. Ofte parret med ISO 27001 for organisationer, der driver AI-systemer med personlige data.
Indien DPDP Act
Indiens lov om beskyttelse af digitale personoplysninger (2023), håndhævet fra 2025. Kræver eksplicit samtykke til behandling af indiske indbyggeres personlige data, lokalisering af data for følsomme data og underretning om brud inden for 72 timer. Gælder organisationer globalt, der behandler indiske borgeres data.
Tekniske Begreber
Navngiven Enhedsgenkendelse (NER)
En NLP-teknik, der identificerer og klassificerer navngivne enheder i tekst i foruddefinerede kategorier såsom personnavne, steder og organisationer.
Natural Language Processing (NLP)
En gren af kunstig intelligens, der gør det muligt for computere at forstå, fortolke og generere menneskelig sprog.
Mønstergenkender
En regelbaseret detektor, der bruger regulære udtryk og kontekstuelle spor til at identificere specifikke datamønstre, såsom kreditkortnumre eller CPR-numre.
Tillidsscore
En numerisk værdi mellem 0 og 1, der angiver, hvor sikker en detektionsmotor er på, at et stykke tekst matcher en specifik enhedstype.
Regulært Udtryk (Regex)
En sekvens af tegn, der definerer et søgemønster, almindeligt anvendt til at validere og opdage strukturerede dataformater som telefonnumre eller e-mailadresser.
AES-256-GCM
En autentificeret krypteringsalgoritme, der bruger en 256-bit nøgle med Galois/Counter Mode, der giver både fortrolighed og integritetsverifikation af krypterede data.
Zero-Knowledge Encryption
En krypteringsarkitektur, hvor kun brugeren har decryption-nøglen, hvilket betyder, at selv tjenesteudbyderen ikke kan tilgå den ukrypterede data.
Tokenisering
Erstatning af følsomme data med ikke-følsomme pladsholdertokens, der kan kortlægges tilbage til de oprindelige data gennem en sikker opslag.
Datamaskering
Sløring af specifikke data inden for et datasæt, så følsomme oplysninger er skjult, mens dataene forbliver brugbare til test eller analyse.
Redigering
Den permanente fjernelse af følsomme oplysninger fra et dokument eller datasæt, der erstatter det med en markør som [REDACTED].
Syntetiske data
AI-genererede data, der statistisk efterligner virkelige data uden at indeholde faktiske poster. Sammenlignet med anonymisering: anonymiserede data bevarer højere analytisk nøjagtighed for downstream ML; syntetiske data eliminerer risikoen for genidentifikation, men introducerer statistisk drift. Reversibel anonymisering foretrækkes, når originale optegnelser kan være nødvendige for overholdelsesrevisioner.
LLM prompt injektion
En angrebsteknik, hvor ondsindet input manipulerer en stor sprogmodel til at ignorere instruktioner eller lække følsomme oplysninger. I PII-beskyttelseskontekster kan hurtig indsprøjtning få en AI-model til at afsløre anonymiserede datamønstre eller brugeroplysninger. Præ-anonymisering af input, før de når LLM'er, reducerer angrebsoverfladen.
Privacy-by-Design
A GDPR Art. 25 princip, der kræver, at databeskyttelse indbygges i systemer fra bunden i stedet for at blive tilføjet som en eftertanke. For AI-systemer betyder privacy-by-design anonymisering af data, før de kommer ind i AI-pipelines, implementering af nul-viden-kryptering og minimering af dataopbevaring.
Anonymiseringsmetoder
Erstat
Substituerer detekteret PII med en generisk pladsholder af samme enhedstype, såsom at erstatte 'John Smith' med '<PERSON>'.
Masker
Delvist slører PII ved at erstatte tegn med maskeringssymboler, for eksempel ved at ændre '123-45-6789' til '***-**-6789'.
Rediger
Fjerner fuldstændigt detekteret PII fra teksten, uden at efterlade spor af den oprindelige værdi.
Hash
Konverterer PII til en fast længde kryptografisk hash, hvilket muliggør konsekvent erstatning, mens det gør omvendelse beregningsmæssigt uoverkommelig.
Krypter
Transformerer PII ved hjælp af AES-256-GCM kryptering med en brugerholdt nøgle, hvilket muliggør autoriseret omvendelse (de-anonymisering) når det er nødvendigt.
Ofte Stillede Spørgsmål
Hvad er forskellen mellem anonymisering og pseudonymisering?
Anonymisering fjerner irreversibelt alle identificerende oplysninger, så re-identifikation er umulig. Pseudonymisering erstatter identifikatorer med kunstige, mens der holdes en separat nøgle, der muliggør re-identifikation, når det er autoriseret. Under GDPR betragtes pseudonymiserede data stadig som personoplysninger.
Hvorfor bruger PII-detektion både NLP og mønstergenkendere?
NLP-modeller opdager kontekstavhængige enheder som personnavne og steder, der mangler et fast format. Mønstergenkendere bruger regulære udtryk til at fange strukturerede identifikatorer som CPR-numre, kreditkortnumre og telefonnumre. Kombinationen af begge tilgange maksimerer detektionsnøjagtigheden på tværs af alle enhedstyper.
Hvad er zero-knowledge kryptering, og hvorfor er det vigtigt?
Zero-knowledge kryptering betyder, at kun du har decryption-nøglen — tjenesteudbyderen kan ikke læse dine data. Dette er vigtigt, fordi selv i tilfælde af et serverbrud forbliver dine krypterede data ulæselige uden din nøgle, hvilket giver den stærkest mulige databeskyttelse.
Hvordan adskiller reversibel kryptering sig fra hashing?
Hashing er en envejstransformation — når data er hashet, kan den oprindelige ikke gendannes. Reversibel kryptering (ved hjælp af AES-256-GCM) tillader autoriserede brugere med den korrekte nøgle at dekryptere og gendanne de oprindelige data, hvilket muliggør arbejdsgange, hvor de-anonymisering er nødvendig.