Cum Funcționează Detectarea
Potrivire de Modele Regex (PII Structurat)
317 PatternRecognizers personalizate cu modele regex detectează date structurate precum ID-uri naționale, numere fiscale, pașapoarte și permise de conducere. Fiecare model folosește aserțiuni de limită pentru a preveni potrivirile false în cod sau date structurate.
Recunoaștere de Entități Nume NLP (Nume și Locații)
spaCy (25 de limbi), NER Stanza (7 limbi) și transformatoarele XLM-RoBERTa (16 limbi) detectează PII nestructurat precum nume de persoane, locații și organizații care nu pot fi capturate doar de regex. Toate modelele rulează pe serverele noastre din Germania — niciun fel de date nu sunt trimise către Meta, Google, Stanford sau orice terță parte.
Scor de Încredere
Fiecare detectare include un scor de încredere (0.0–1.0) pentru decizii umane în buclă. Formatele foarte specifice (de exemplu, IBAN german DE89 3704 0044 0532 0130 00) au un scor de 0.85+, în timp ce modelele generice de cifre au un scor de 0.3–0.5 și se bazează pe cuvinte de context pentru confirmare. Echipele de conformitate pot revizui și anula detectările înainte de anonimizare.
Analiza Cuvintelor de Context
Fiecare recunoaștere are cuvinte de context în limba relevantă (de exemplu, 'Personalausweis' pentru ID-urile germane, 'kitambulisho' pentru ID-urile kenyene). Când cuvintele de context apar lângă o potrivire, scorul de încredere este crescut.
Tipuri de Entități Suportate
Acoperire cuprinzătoare a tipurilor de informații personale pe categorii
Identificatori Personali
- Nume de Persoane
- Adrese de Email
- Numere de Telefon
- Data Nașterii
- Vârstă
- Gen
- Naționalitate
Informații Financiare
- Numere de Card de Credit
- IBAN
- BIC/SWIFT
- Numere de Cont Bancar
- ID-uri Fiscale
- Numere TVA
ID-uri Guvernamentale
- Numere de Securitate Socială (SSN)
- Numere de ID Național
- Numere de Pașaport
- Permise de Conducere
- ID-uri de Asigurare de Sănătate
Date de Locație
- Adrese Stradale
- Orașe
- Coduri Poștale
- Țări
- Coordonate GPS
Identificatori Digitali
- Adrese IP (v4/v6)
- Adrese MAC
- URL-uri
- Nume de Domenii
- ID-uri de Utilizator
Date Organizaționale
- Nume de Companii
- ID-uri de Organizații
- Numere de Înregistrare
- Nume de Departamente
Date Temporale
- Date
- Ore
- Intervale de Date
- Marcaje Temporale
Formate Internaționale
- ID German (Personalausweis)
- Asigurare Națională UK
- DNI/NIE Spaniol
- Codice Fiscale Italian
- Și peste 70 de alte formate specifice țării
Suport pentru Entități Personalizate
Trebuie să detectați modele personalizate? Creați-vă propriile tipuri de entități cu modele regex sau folosiți generatorul nostru de modele asistat de AI.
Creare Manuală de Modele
Definiți modele regex pentru identificatori proprietari precum ID-uri interne de angajați, coduri de proiect sau numere de referință personalizate.
Generator de Modele AI
Descrieți ce doriți să detectați în limbaj simplu, iar AI-ul nostru generează pentru dvs. modele regex optimizate.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient