Detecció de PII: Més de 320 tipus d'entitats

El nostre motor de detecció combina 317 reconeixedors regex personalitzats amb models de NLP per identificar més de 320 tipus d'informació personal a més de 70 països. Mateix input, mateix output - cada vegada.

Com Funciona la Detecció

Coincidència de Patrons Regex (PII Estructurat)

317 PatternRecognizers personalitzats amb patrons regex detecten dades estructurades com ID nacionals, números fiscals, passaports i permisos de conduir. Cada patró utilitza afirmacions de límit per evitar coincidències falses en codi o dades estructurades.

Reconeixement d'Entitats Nominals NLP (Noms i Localitzacions)

spaCy (25 idiomes), NER Stanza (7 idiomes) i transformadors XLM-RoBERTa (16 idiomes) detecten PII no estructurat com noms de persones, localitzacions i organitzacions que no poden ser capturats només per regex. Tots els models s'executen als nostres propis servidors a Alemanya — mai s'envien dades a Meta, Google, Stanford o cap tercer.

Puntuació de Confiança

Cada detecció inclou una puntuació de confiança (0.0–1.0) per a decisions humanes en el bucle. Els formats altament específics (per exemple, IBAN alemany DE89 3704 0044 0532 0130 00) puntuen 0.85+, mentre que els patrons de dígits genèrics puntuen 0.3–0.5 i depenen de paraules de context per a la confirmació. Els equips de compliment poden revisar i anul·lar deteccions abans de l'anonimització.

Anàlisi de Paraules de Context

Cada reconeixedor té paraules de context en l'idioma rellevant (per exemple, 'Personalausweis' per a ID alemanys, 'kitambulisho' per a ID kenyans). Quan les paraules de context apareixen prop d'una coincidència, la puntuació de confiança es veu augmentada.

Tipus d'Entitats Suportades

Cobertura completa dels tipus d'informació personal a través de categories

Identificadors Personals

  • Noms de Persona
  • Adreces de Correu Electrònic
  • Números de Telèfon
  • Data de Naixement
  • Edat
  • Gènere
  • Nacionalitat

Informació Financera

  • Números de Targeta de Crèdit
  • IBAN
  • BIC/SWIFT
  • Números de Compte Bancari
  • ID Fiscals
  • Números de IVA

ID Governamentals

  • Números de Seguretat Social (SSN)
  • Números d'ID Nacionals
  • Números de Passaport
  • Permisos de Conduir
  • ID d'Assegurança de Salut

Dades de Localització

  • Adreces
  • Ciutats
  • Codis Postals
  • Països
  • Coordenades GPS

Identificadors Digitals

  • Adreces IP (v4/v6)
  • Adreces MAC
  • URLs
  • Noms de Domini
  • ID d'Usuari

Dades d'Organització

  • Noms d'Empresa
  • ID d'Organització
  • Números de Registre
  • Noms de Departament

Dades Temporals

  • Dates
  • Hores
  • Intervals de Dates
  • Marques de Temps

Formats Internacionals

  • ID Alemany (Personalausweis)
  • Assegurança Nacional del Regne Unit
  • DNI/NIE Espanyol
  • Codice Fiscale Italià
  • I més de 70 formats específics per país

Suport d'Entitats Personalitzades

Necessiteu detectar patrons personalitzats? Creeu els vostres propis tipus d'entitats amb patrons regex o utilitzeu el nostre generador de patrons assistit per IA.

Creació Manual de Patrons

Definiu patrons regex per a identificadors propietaris com ID d'empleats interns, codis de projectes o números de referència personalitzats.

Generador de Patrons IA

Descriviu el que voleu detectar en llenguatge senzill, i la nostra IA generarà patrons regex optimitzats per a vostè.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Comenceu a Detectar PII Avui

Proveu el nostre motor de detecció gratuïtament amb 200 tokens per cicle. No es requereix targeta de crèdit.