PII Noteikšana: 320+ Entitāšu Veidi

Mūsu noteikšanas dzinējs apvieno 317 pielāgotus regex atpazītājus ar NLP modeļiem, lai identificētu vairāk nekā 320 personiskās informācijas veidus 70+ valstīs. Vienāds ievads, vienāds iznākums - katru reizi.

Kā Darbojas Noteikšana

Regex Paraugu Atbilstība (Strukturēts PII)

317 pielāgoti PatternRecognizers ar regex paraugiem nosaka strukturētus datus, piemēram, nacionālos ID, nodokļu numurus, pases un vadītāja apliecības. Katrs paraugs izmanto robežu apgalvojumus, lai novērstu kļūdainas atbilstības kodā vai strukturētos datos.

NLP Nosaukto Entitāšu Atpazīšana (Vārdi un Atrašanās Vietas)

spaCy (25 valodas), Stanza NER (7 valodas) un XLM-RoBERTa transformatori (16 valodas) nosaka nestrukturētu PII, piemēram, personu vārdus, atrašanās vietas un organizācijas, kuras nevar uztvert tikai ar regex. Visi modeļi darbojas uz mūsu serveriem Vācijā — dati nekad netiek nosūtīti uz Meta, Google, Stanford vai jebkuru trešo pusi.

Pārliecības Vērtēšana

Katra noteikšana ietver pārliecības vērtējumu (0.0–1.0) cilvēka lēmumiem. Ļoti specifiski formāti (piemēram, Vācijas IBAN DE89 3704 0044 0532 0130 00) saņem vērtējumu 0.85+, savukārt vispārīgi ciparu paraugi saņem vērtējumu 0.3–0.5 un paļaujas uz konteksta vārdiem apstiprināšanai. Atbilstības komandas var pārskatīt un pārdefinēt noteikumus pirms anonimizācijas.

Konteksta Vārdu Analīze

Katram atpazītājam ir konteksta vārdi attiecīgajā valodā (piemēram, 'Personalausweis' Vācijas ID, 'kitambulisho' Kenijas ID). Kad konteksta vārdi parādās tuvu atbilstībai, pārliecības vērtējums tiek paaugstināts.

Atbalstītie Entitāšu Veidi

Visaptverošs personiskās informācijas veidu pārklājums pa kategorijām

Personiskie Identifikatori

  • Personu Vārdi
  • E-pasta Adreses
  • Tālruņu Numuri
  • Dzimšanas Datums
  • Vecums
  • Dzimums
  • Pilsonība

Finanšu Informācija

  • Kredītkaršu Numuri
  • IBAN
  • BIC/SWIFT
  • Bankas Kontu Numuri
  • Nodokļu ID
  • PVN Numuri

Valdības ID

  • Sociālās Apdrošināšanas Numuri (SSN)
  • Nacionālie ID Numuri
  • Pases Numuri
  • Vadītāja Apliecība
  • Veselības Apdrošināšanas ID

Atrašanās Vietas Dati

  • Ielu Adreses
  • Pilsētas
  • Pasta Kodu/ZIP
  • Valstis
  • GPS Koordinātas

Digitālie Identifikatori

  • IP Adreses (v4/v6)
  • MAC Adreses
  • URL
  • Domēna Vārdi
  • Lietotāju ID

Organizācijas Dati

  • Uzņēmumu Nosaukumi
  • Organizācijas ID
  • Reģistrācijas Numuri
  • Departamentu Nosaukumi

Laika Dati

  • Datumi
  • Laiki
  • Datumu Diapazoni
  • Laika Zīmogi

Starptautiskie Formāti

  • Vācijas ID (Personalausweis)
  • Apvienotās Karalistes Nacionālās Apdrošināšanas
  • Spānijas DNI/NIE
  • Itālijas Codice Fiscale
  • Un vēl 70+ valstu specifiski formāti

Pielāgotu Entitāšu Atbalsts

Nepieciešams noteikt pielāgotus paraugus? Izveidojiet savus entitāšu veidus ar regex paraugiem vai izmantojiet mūsu AI atbalstītu paraugu ģeneratoru.

Manuāla Parauga Izveide

Definējiet regex paraugus īpašiem identifikatoriem, piemēram, iekšējiem darbinieku ID, projektu kodiem vai pielāgotiem atsauces numuriem.

AI Parauga Ģenerators

Aprakstiet, ko vēlaties noteikt vienkāršā valodā, un mūsu AI ģenerēs optimizētus regex paraugus jums.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Sāciet Noteikt PII Šodien

Izmēģiniet mūsu noteikšanas dzinēju bez maksas ar 200 žetoniem ciklā. Nav nepieciešama kredītkarte.