Hvorfor regex-basert?

For regulatorisk samsvar trenger du resultater du kan forklare og reprodusere. Vår regex-baserte tilnærming gir deterministisk deteksjon av strukturerte data, mens NLP håndterer navn og steder med transparente tillitspoeng.

Detaljert sammenligning

	Regex-basert (oss)	AI/ML-basert
Reproduserbarhet	Strukturerte data: 100 % identisk. Navn: tillitspoeng	Alle resultater varierer mellom kjøringer
Etterprøvbarhet	Hver deteksjon kan spores til mønster eller NLP-modell	Svart boks — kan ikke forklare avgjørelser
Treningsdata	Regex: ingen. NLP: forhåndstrente modeller inkludert	Krever tilpassede treningsdatasett
Modelldrift	Regex: ingen. NLP: versjonerte, stabile modeller	Forringes uforutsigbart over tid
Ytelse	Rask, kun CPU	Variabel, avhengig av GPU
Beregningkostnad	Lav (kun CPU)	Høy (GPU ofte nødvendig)
Regulatorisk samsvar	Enkelt — mønstre + tillitspoeng kan etterprøves med manuell gjennomgang	Vanskelig å bevise overfor tilsynsmyndigheter

Slik fungerer mønstermatching

Hver enhetstype har nøye utformede regex-mønstre som matcher spesifikke formater.

E-postadresser

Matcher standard e-postformat: lokal-del@domene.tld

Kredittkortnummer

Matcher Visa, Mastercard, Amex og andre kortformater med Luhn-validering

Tysk IBAN

Matcher tysk IBAN-format med valgfrie mellomrom

Bygget for samsvar

Når revisorer spør «hvorfor ble dette oppdaget?», trenger du et klart svar. Regex-deteksjoner spores til et spesifikt mønster. NLP-deteksjoner inkluderer modellnavn og tillitspoeng. Manuell gjennomgang sikrer at samsvarsteam kan overstyre deteksjoner før anonymisering.

GDPR artikkel 25: Personvern som standard med forklarbar behandling
ISO 27001: Dokumenterte, repeterbare prosesser
Revisjonsspor: Hver deteksjon kan spores til et spesifikt mønster

Eksempel på revisjonssvar

Q: Hvorfor ble «john.smith@company.com» flagget?

A: Matchet e-postmønster på posisjon 45-68 med tillit 0,95. Mønster: standard e-postformatvalidering.

Opplev deterministisk deteksjon

Prøv vår regex-baserte PII-deteksjon gratis med 200 tokens per syklus.