Hvorfor regex først?
For regulatorisk compliance har du brug for resultater, du kan forklare og reproducere. Vores regex-baserede tilgang gør detektion af strukturerede data fuldt deterministisk, mens NLP håndterer navne og lokationer med gennemsigtige tillidsscorer.
Detaljeret sammenligning
| Regex-baseret (os) | AI/ML-baseret | |
|---|---|---|
| Reproducerbarhed | Strukturerede data: 100% identiske. Navne: tillidsscore | Alle resultater varierer mellem kørsel |
| Reviderbarhed | Hver detektion kan spores til mønster eller NLP-model | Sort boks — kan ikke forklare beslutninger |
| Træningsdata | Regex: ingen. NLP: fortrænede modeller inkluderet | Kræver brugerdefinerede træningsdatasæt |
| Modeldrift | Regex: ingen. NLP: versionerede, stabile modeller | Forringes uforudsigeligt over tid |
| Ydeevne | Hurtig, kun CPU | Variabel, afhængig af GPU |
| Beregningomkostning | Lav (kun CPU) | Høj (GPU ofte nødvendig) |
| Regulatorisk compliance | Let — mønstre + tillidsscorer kan revideres med menneskelig gennemgang | Svært at bevise overfor myndigheder |
Sådan fungerer mønstergenkendelse
Hver entity-type har nøje udformede regex-mønstre, der matcher specifikke formater.
E-mailadresser
Matcher standard e-mailformat: lokal-del@domæne.tld
Kreditkortnumre
Matcher Visa, Mastercard, Amex og andre kortformater med Luhn-validering
Tysk IBAN
Matcher tysk IBAN-format med valgfrie mellemrum
Bygget til compliance
Når revisorer spørger "hvorfor blev dette detekteret?" skal du kunne give et klart svar. Regex-detektioner kan spores til et specifikt mønster. NLP-detektioner inkluderer modelnavn og tillidsscore. Menneskelig gennemgang sikrer, at compliance-teams kan tilsidesætte detektioner før anonymisering.
- GDPR artikel 25: Privacy by design med forklarlig behandling
- ISO 27001: Dokumenterede, gentagelige processer
- Audit trail: Hver detektion kan spores til et specifikt mønster
Eksempel på auditsvar
Q: Hvorfor blev "john.smith@company.com" markeret?
A: Matchede e-mailmønster på position 45-68 med tillid 0,95. Mønster: standard e-mailformatvalidering.