Kaip Veikia Aptikimas
Regex Šablonų Atitikimas (Struktūrizuota PII)
317 individualių PatternRecognizers su regex šablonais aptinka struktūrizuotus duomenis, tokius kaip nacionaliniai ID, mokesčių numeriai, pasai ir vairuotojo pažymėjimai. Kiekvienas šablonas naudoja ribų patvirtinimus, kad išvengtų klaidingų atitikimų kode ar struktūrizuotuose duomenyse.
NLP Pavadintų Subjektų Atpažinimas (Vardai ir Vietos)
spaCy (25 kalbos), Stanza NER (7 kalbos) ir XLM-RoBERTa transformatoriai (16 kalbų) aptinka nestruktūrizuotą PII, kaip asmenų vardai, vietos ir organizacijos, kurių negalima užfiksuoti tik regex. Visi modeliai veikia mūsų serveriuose Vokietijoje — duomenys niekada nėra siunčiami Meta, Google, Stanford ar jokiai trečiajai šaliai.
Pasitikėjimo Vertinimas
Kiekvienas aptikimas apima pasitikėjimo balą (0.0–1.0) žmogaus sprendimams. Labai specifiniai formatai (pvz., Vokietijos IBAN DE89 3704 0044 0532 0130 00) gauna 0.85+ balą, o bendrieji skaitmeniniai šablonai gauna 0.3–0.5 ir remiasi konteksto žodžiais patvirtinimui. Atitikties komandos gali peržiūrėti ir pakeisti aptikimus prieš anonimizavimą.
Konteksto Žodžių Analizė
Kiekvienas atpažinimo įrankis turi konteksto žodžius atitinkama kalba (pvz., 'Personalausweis' vokiečių ID, 'kitambulisho' Kenijos ID). Kai konteksto žodžiai pasirodo šalia atitikimo, pasitikėjimo balas padidėja.
Palaikomi Subjektų Tipai
Išsamus asmeninės informacijos tipų aprėptis pagal kategorijas
Asmeniniai Identifikatoriai
- Asmenų Vardai
- El. Pašto Adresai
- Telefono Numeriai
- Gimimo Data
- Amžius
- Lytis
- Tautybė
Finansinė Informacija
- Kreditinių Kortelių Numeriai
- IBAN
- BIC/SWIFT
- Banko Sąskaitų Numeriai
- Mokesčių ID
- PVM Numeriai
Vyriausybės ID
- Socialinio Draudimo Numeriai (SSN)
- Nacionaliniai ID Numeriai
- Paso Numeriai
- Vairuotojo Pažymėjimai
- Sveikatos Draudimo ID
Vietos Duomenys
- Gatvių Adresai
- Miestai
- Pašto Kodai
- Šalys
- GPS Koordinatės
Skaitmeniniai Identifikatoriai
- IP Adresai (v4/v6)
- MAC Adresai
- URL
- Domenų Vardai
- Vartotojo ID
Organizacijos Duomenys
- Įmonių Pavadinimai
- Organizacijos ID
- Registracijos Numeriai
- Skyrių Pavadinimai
Laiko Duomenys
- Datos
- Laikai
- Datų Intervalai
- Laiko Žymos
Tarptautiniai Formatai
- Vokietijos ID (Personalausweis)
- JK Nacionalinis Draudimas
- Ispanijos DNI/NIE
- Italijos Codice Fiscale
- Ir dar 70+ šalių specifinių formatų
Individualių Subjektų Palaikymas
Reikia aptikti individualius šablonus? Sukurkite savo subjektų tipus su regex šablonais arba naudokite mūsų AI pagalbinį šablonų generatorių.
Rankinis Šablonų Kūrimas
Apibrėžkite regex šablonus nuosavybiniams identifikatoriams, tokiems kaip vidiniai darbuotojų ID, projektų kodai ar individualūs nuorodų numeriai.
AI Šablonų Generatorius
Apibūdinkite, ką norite aptikti paprasta kalba, ir mūsų AI sugeneruos optimizuotus regex šablonus jums.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient