Hvorfor regex-basert?
For regulatorisk samsvar trenger du resultater du kan forklare og reprodusere. Vår regex-baserte tilnærming gir deterministisk deteksjon av strukturerte data, mens NLP håndterer navn og steder med transparente tillitspoeng.
Detaljert sammenligning
| Regex-basert (oss) | AI/ML-basert | |
|---|---|---|
| Reproduserbarhet | Strukturerte data: 100 % identisk. Navn: tillitspoeng | Alle resultater varierer mellom kjøringer |
| Etterprøvbarhet | Hver deteksjon kan spores til mønster eller NLP-modell | Svart boks — kan ikke forklare avgjørelser |
| Treningsdata | Regex: ingen. NLP: forhåndstrente modeller inkludert | Krever tilpassede treningsdatasett |
| Modelldrift | Regex: ingen. NLP: versjonerte, stabile modeller | Forringes uforutsigbart over tid |
| Ytelse | Rask, kun CPU | Variabel, avhengig av GPU |
| Beregningkostnad | Lav (kun CPU) | Høy (GPU ofte nødvendig) |
| Regulatorisk samsvar | Enkelt — mønstre + tillitspoeng kan etterprøves med manuell gjennomgang | Vanskelig å bevise overfor tilsynsmyndigheter |
Slik fungerer mønstermatching
Hver enhetstype har nøye utformede regex-mønstre som matcher spesifikke formater.
E-postadresser
Matcher standard e-postformat: lokal-del@domene.tld
Kredittkortnummer
Matcher Visa, Mastercard, Amex og andre kortformater med Luhn-validering
Tysk IBAN
Matcher tysk IBAN-format med valgfrie mellomrom
Bygget for samsvar
Når revisorer spør «hvorfor ble dette oppdaget?», trenger du et klart svar. Regex-deteksjoner spores til et spesifikt mønster. NLP-deteksjoner inkluderer modellnavn og tillitspoeng. Manuell gjennomgang sikrer at samsvarsteam kan overstyre deteksjoner før anonymisering.
- GDPR artikkel 25: Personvern som standard med forklarbar behandling
- ISO 27001: Dokumenterte, repeterbare prosesser
- Revisjonsspor: Hver deteksjon kan spores til et spesifikt mønster
Eksempel på revisjonssvar
Q: Hvorfor ble «john.smith@company.com» flagget?
A: Matchet e-postmønster på posisjon 45-68 med tillit 0,95. Mønster: standard e-postformatvalidering.