Hogyan Működik a Felismerés
Regex Mintaillesztés (Strukturált PII)
317 egyedi PatternRecognizers regex mintákkal észleli a strukturált adatokat, mint a nemzeti azonosítók, adószámok, útlevelek és vezetői engedélyek. Minden minta határfeltételeket használ, hogy megakadályozza a hamis egyezéseket a kódban vagy strukturált adatokban.
NLP Nevezett Entitás Felismerés (Nevek és Helyszínek)
spaCy (25 nyelv), Stanza NER (7 nyelv) és XLM-RoBERTa transzformerek (16 nyelv) észlelik a strukturálatlan PII-t, mint a személynevek, helyszínek és szervezetek, amelyeket a regex önmagában nem tud megragadni. Minden modell saját szervereinken fut Németországban — az adatok soha nem kerülnek a Meta, Google, Stanford vagy bármely harmadik félhez.
Bizalmi Pontozás
Minden felismerés tartalmaz egy bizalmi pontszámot (0,0–1,0) az emberi döntéshozatalhoz. A nagyon specifikus formátumok (pl. német IBAN DE89 3704 0044 0532 0130 00) 0,85+ pontot kapnak, míg az általános számjegy minták 0,3–0,5 pontot kapnak, és kontextus szavakra támaszkodnak a megerősítéshez. A megfelelőségi csapatok felülvizsgálhatják és felülbírálhatják a felismeréseket az anonimizálás előtt.
Kontextus Szóelemzés
Minden felismerő rendelkezik kontextus szavakkal a releváns nyelven (pl. 'Personalausweis' a német azonosítókhoz, 'kitambulisho' a kenyai azonosítókhoz). Amikor a kontextus szavak megjelennek egy egyezés közelében, a bizalmi pontszám növekszik.
Támogatott Entitástípusok
Átfogó lefedettség a személyes adatok típusai között kategóriák szerint
Személyes Azonosítók
- Személynevek
- Email Címek
- Telefonszámok
- Születési Dátum
- Életkor
- Nem
- Állampolgárság
Pénzügyi Információk
- Hitelkártyaszámok
- IBAN
- BIC/SWIFT
- Bankszámlaszámok
- Adószámok
- ÁFA Számok
Kormányzati Azonosítók
- Társadalombiztosítási Számok (SSN)
- Nemzeti Azonosító Számok
- Útlevélszámok
- Vezetői Engedély
- Egészségbiztosítási Azonosítók
Helyadatok
- Utca Címek
- Városok
- Irányítószámok/Postai Kódok
- Országok
- GPS Koordináták
Digitális Azonosítók
- IP Címek (v4/v6)
- MAC Címek
- URL-ek
- Domain Nevek
- Felhasználói Azonosítók
Szervezeti Adatok
- Cégnév
- Szervezeti Azonosítók
- Regisztrációs Számok
- Osztálynevek
Időbeli Adatok
- Dátumok
- Idők
- Dátumtartományok
- Időbélyegek
Nemzetközi Formátumok
- Német ID (Personalausweis)
- UK Nemzeti Biztosítás
- Spanyol DNI/NIE
- Olasz Codice Fiscale
- És több mint 70 más ország-specifikus formátum
Egyedi Entitás Támogatás
Egyedi mintákat kell észlelnie? Hozzon létre saját entitástípusokat regex mintákkal vagy használja AI-alapú mintagenerátorunkat.
Kézi Minta Létrehozás
Határozza meg a regex mintákat saját azonosítókhoz, mint például belső alkalmazotti azonosítók, projektkódok vagy egyedi hivatkozási számok.
AI Minta Generátor
Írja le, mit szeretne észlelni egyszerű nyelven, és AI-nk optimalizált regex mintákat generál Önnek.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient