Kāpēc regex-pamatota pieeja?
Atbilstībai normatīviem ir nepieciešami rezultāti, kurus varat izskaidrot un atkārtot. Mūsu regex-pamatotā pieeja nodrošina pilnīgi deterministisku strukturētu datu noteikšanu, bet NLP pārvalda vārdus un vietas ar caurspīdīgiem pārliecības rādītājiem.
Detalizēts salīdzinājums
| Regex-pamatota (Mēs) | AI/ML-pamatota | |
|---|---|---|
| Reproducējamība | Strukturētie dati: 100% identiski. Vārdi: ar pārliecības rādītāju | Visi rezultāti atšķiras katrā izpildē |
| Auditējamība | Katra noteikšana izsekojama līdz paraugam vai NLP modelim | Melnā kaste — nav iespējams izskaidrot lēmumus |
| Apmācību dati | Regex: nav. NLP: iekļauti iepriekš apmācīti modeļi | Nepieciešami pielāgoti apmācību datu kopumi |
| Modeļa novirze | Regex: nav. NLP: versijoti, stabili modeļi | Neparedzami pasliktinās laika gaitā |
| Veiktspēja | Ātra, tikai CPU | Mainīga, atkarīga no GPU |
| Aprēķinu izmaksas | Zemas (tikai CPU) | Augstas (bieži nepieciešams GPU) |
| Atbilstība normatīviem | Vienkārši — paraugi + pārliecības rādītāji ir auditējami ar manuālu pārskatīšanu | Grūti pierādīt regulatoriem |
Kā darbojas paraugu atpazīšana
Katram entitātes tipam ir rūpīgi izstrādāti regex paraugi, kas atbilst konkrētiem formātiem.
E-pasta adreses
Atbilst standarta e-pasta formātam: local-part@domain.tld
Kredītkaršu numuri
Atpazīst Visa, Mastercard, Amex un citus karšu formātus ar Luhn validāciju
Vācijas IBAN
Atbilst Vācijas IBAN formātam ar izvēles atstarpēm
Izstrādāts atbilstībai
Kad auditoriem rodas jautājums "kāpēc tas tika noteikts?", Jums nepieciešama skaidra atbilde. Regex noteikšanas ir izsekojamas līdz konkrētam paraugam. NLP noteikšanām ir modeļa nosaukums un pārliecības rādītājs. Manuāla pārskatīšana nodrošina, ka atbilstības komanda var labot noteikumus pirms anonimizācijas.
- GDPR 25. pants: Privātums pēc noklusējuma ar izskaidrojamu apstrādi
- ISO 27001: Dokumentēti, atkārtojami procesi
- Auditācijas žurnāls: Katra noteikšana izsekojama līdz konkrētam paraugam
Auditācijas atbildes piemērs
J: Kāpēc "john.smith@company.com" tika atzīmēts?
A: Atbilst e-pasta paraugam pozīcijā 45-68 ar pārliecību 0.95. Paraugs: standarta e-pasta formāta validācija.