Kāpēc regex-pamatota pieeja?

Atbilstībai normatīviem ir nepieciešami rezultāti, kurus varat izskaidrot un atkārtot. Mūsu regex-pamatotā pieeja nodrošina pilnīgi deterministisku strukturētu datu noteikšanu, bet NLP pārvalda vārdus un vietas ar caurspīdīgiem pārliecības rādītājiem.

Detalizēts salīdzinājums

Regex-pamatota (Mēs)AI/ML-pamatota
ReproducējamībaStrukturētie dati: 100% identiski. Vārdi: ar pārliecības rādītājuVisi rezultāti atšķiras katrā izpildē
AuditējamībaKatra noteikšana izsekojama līdz paraugam vai NLP modelimMelnā kaste — nav iespējams izskaidrot lēmumus
Apmācību datiRegex: nav. NLP: iekļauti iepriekš apmācīti modeļiNepieciešami pielāgoti apmācību datu kopumi
Modeļa novirzeRegex: nav. NLP: versijoti, stabili modeļiNeparedzami pasliktinās laika gaitā
VeiktspējaĀtra, tikai CPUMainīga, atkarīga no GPU
Aprēķinu izmaksasZemas (tikai CPU)Augstas (bieži nepieciešams GPU)
Atbilstība normatīviemVienkārši — paraugi + pārliecības rādītāji ir auditējami ar manuālu pārskatīšanuGrūti pierādīt regulatoriem

Kā darbojas paraugu atpazīšana

Katram entitātes tipam ir rūpīgi izstrādāti regex paraugi, kas atbilst konkrētiem formātiem.

E-pasta adreses

Atbilst standarta e-pasta formātam: local-part@domain.tld

Kredītkaršu numuri

Atpazīst Visa, Mastercard, Amex un citus karšu formātus ar Luhn validāciju

Vācijas IBAN

Atbilst Vācijas IBAN formātam ar izvēles atstarpēm

Izstrādāts atbilstībai

Kad auditoriem rodas jautājums "kāpēc tas tika noteikts?", Jums nepieciešama skaidra atbilde. Regex noteikšanas ir izsekojamas līdz konkrētam paraugam. NLP noteikšanām ir modeļa nosaukums un pārliecības rādītājs. Manuāla pārskatīšana nodrošina, ka atbilstības komanda var labot noteikumus pirms anonimizācijas.

  • GDPR 25. pants: Privātums pēc noklusējuma ar izskaidrojamu apstrādi
  • ISO 27001: Dokumentēti, atkārtojami procesi
  • Auditācijas žurnāls: Katra noteikšana izsekojama līdz konkrētam paraugam

Auditācijas atbildes piemērs

J: Kāpēc "john.smith@company.com" tika atzīmēts?

A: Atbilst e-pasta paraugam pozīcijā 45-68 ar pārliecību 0.95. Paraugs: standarta e-pasta formāta validācija.

Izmēģiniet deterministisku noteikšanu

Izmēģiniet mūsu regex-pamatotu PII noteikšanu bez maksas ar 200 tokeniem ciklā.