Kā Darbojas Noteikšana
Regex Paraugu Atbilstība (Strukturēts PII)
317 pielāgoti PatternRecognizers ar regex paraugiem nosaka strukturētus datus, piemēram, nacionālos ID, nodokļu numurus, pases un vadītāja apliecības. Katrs paraugs izmanto robežu apgalvojumus, lai novērstu kļūdainas atbilstības kodā vai strukturētos datos.
NLP Nosaukto Entitāšu Atpazīšana (Vārdi un Atrašanās Vietas)
spaCy (25 valodas), Stanza NER (7 valodas) un XLM-RoBERTa transformatori (16 valodas) nosaka nestrukturētu PII, piemēram, personu vārdus, atrašanās vietas un organizācijas, kuras nevar uztvert tikai ar regex. Visi modeļi darbojas uz mūsu serveriem Vācijā — dati nekad netiek nosūtīti uz Meta, Google, Stanford vai jebkuru trešo pusi.
Pārliecības Vērtēšana
Katra noteikšana ietver pārliecības vērtējumu (0.0–1.0) cilvēka lēmumiem. Ļoti specifiski formāti (piemēram, Vācijas IBAN DE89 3704 0044 0532 0130 00) saņem vērtējumu 0.85+, savukārt vispārīgi ciparu paraugi saņem vērtējumu 0.3–0.5 un paļaujas uz konteksta vārdiem apstiprināšanai. Atbilstības komandas var pārskatīt un pārdefinēt noteikumus pirms anonimizācijas.
Konteksta Vārdu Analīze
Katram atpazītājam ir konteksta vārdi attiecīgajā valodā (piemēram, 'Personalausweis' Vācijas ID, 'kitambulisho' Kenijas ID). Kad konteksta vārdi parādās tuvu atbilstībai, pārliecības vērtējums tiek paaugstināts.
Atbalstītie Entitāšu Veidi
Visaptverošs personiskās informācijas veidu pārklājums pa kategorijām
Personiskie Identifikatori
- Personu Vārdi
- E-pasta Adreses
- Tālruņu Numuri
- Dzimšanas Datums
- Vecums
- Dzimums
- Pilsonība
Finanšu Informācija
- Kredītkaršu Numuri
- IBAN
- BIC/SWIFT
- Bankas Kontu Numuri
- Nodokļu ID
- PVN Numuri
Valdības ID
- Sociālās Apdrošināšanas Numuri (SSN)
- Nacionālie ID Numuri
- Pases Numuri
- Vadītāja Apliecība
- Veselības Apdrošināšanas ID
Atrašanās Vietas Dati
- Ielu Adreses
- Pilsētas
- Pasta Kodu/ZIP
- Valstis
- GPS Koordinātas
Digitālie Identifikatori
- IP Adreses (v4/v6)
- MAC Adreses
- URL
- Domēna Vārdi
- Lietotāju ID
Organizācijas Dati
- Uzņēmumu Nosaukumi
- Organizācijas ID
- Reģistrācijas Numuri
- Departamentu Nosaukumi
Laika Dati
- Datumi
- Laiki
- Datumu Diapazoni
- Laika Zīmogi
Starptautiskie Formāti
- Vācijas ID (Personalausweis)
- Apvienotās Karalistes Nacionālās Apdrošināšanas
- Spānijas DNI/NIE
- Itālijas Codice Fiscale
- Un vēl 70+ valstu specifiski formāti
Pielāgotu Entitāšu Atbalsts
Nepieciešams noteikt pielāgotus paraugus? Izveidojiet savus entitāšu veidus ar regex paraugiem vai izmantojiet mūsu AI atbalstītu paraugu ģeneratoru.
Manuāla Parauga Izveide
Definējiet regex paraugus īpašiem identifikatoriem, piemēram, iekšējiem darbinieku ID, projektu kodiem vai pielāgotiem atsauces numuriem.
AI Parauga Ģenerators
Aprakstiet, ko vēlaties noteikt vienkāršā valodā, un mūsu AI ģenerēs optimizētus regex paraugus jums.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient