Zašto Regex-Prvo?
Za regulatornu usklađenost trebate rezultate koje možete objasniti i reproducirati. Naš pristup s regularnim izrazima omogućuje potpuno determinističku detekciju strukturiranih podataka, dok NLP obrađuje imena i lokacije s transparentnim ocjenama pouzdanosti.
Detaljna Usporedba
| Regex-Prvo (Mi) | AI/ML-Temeljeno | |
|---|---|---|
| Ponovljivost | Strukturirani podaci: 100% identični. Imena: s ocjenom pouzdanosti | Svi rezultati variraju između pokretanja |
| Revizibilnost | Svaka detekcija može se pratiti do uzorka ili NLP modela | Crna kutija — odluke se ne mogu objasniti |
| Podaci za Treniranje | Regex: nema. NLP: uključeni predtrenirani modeli | Zahtijeva prilagođene skupove podataka za treniranje |
| Promjena Modela | Regex: nema. NLP: verzionirani, stabilni modeli | Točnost se nepredvidivo smanjuje tijekom vremena |
| Performanse | Brzo, samo CPU | Varijabilno, ovisi o GPU-u |
| Trošak Obračuna | Nizak (samo CPU) | Visok (često potreban GPU) |
| Regulatorna Usklađenost | Jednostavno — uzorci + ocjene pouzdanosti su revizibilni uz ljudski nadzor | Teško dokazivo regulatorima |
Kako Funkcionira Prepoznavanje Uzoraka
Svaki tip entiteta ima pažljivo izrađene regex uzorke koji odgovaraju specifičnim formatima.
Email Adrese
Prepoznaje standardni format email adrese: local-part@domain.tld
Brojevi Kreditnih Kartica
Prepoznaje Visa, Mastercard, Amex i druge formate kartica uz Luhn provjeru
Njemački IBAN
Prepoznaje njemački IBAN format s opcionalnim razmacima
Dizajnirano za Usklađenost
Kada revizori pitaju "zašto je ovo detektirano?" trebate jasan odgovor. Detekcije putem regexa se mogu pratiti do određenog uzorka. NLP detekcije uključuju naziv modela i ocjenu pouzdanosti. Ljudska provjera osigurava da timovi za usklađenost mogu nadjačati detekcije prije anonimizacije.
- GDPR Članak 25: Privatnost po dizajnu s objašnjivom obradom
- ISO 27001: Dokumentirani, ponovljivi procesi
- Revizijski trag: Svaka detekcija može se pratiti do određenog uzorka
Primjer Odgovora na Reviziju
P: Zašto je "john.smith@company.com" označen?
O: Podudaranje s email uzorkom na poziciji 45-68 s pouzdanošću 0.95. Uzorak: standardna validacija email formata.