Detecção de PII: 320+ Tipos de Entidades

Nosso motor de detecção combina 317 reconhecedores de regex personalizados com modelos de NLP para identificar mais de 320 tipos de informações pessoais em mais de 70 países. Mesmo input, mesmo output - sempre.

Como Funciona a Detecção

Correspondência de Padrões Regex (PII Estruturado)

317 PatternRecognizers personalizados com padrões regex detectam dados estruturados como IDs nacionais, números fiscais, passaportes e carteiras de motorista. Cada padrão usa afirmações de limite para evitar correspondências falsas em código ou dados estruturados.

Reconhecimento de Entidades Nomeadas por NLP (Nomes e Localizações)

spaCy (25 idiomas), NER Stanza (7 idiomas) e transformadores XLM-RoBERTa (16 idiomas) detectam PII não estruturado como nomes de pessoas, localizações e organizações que não podem ser capturados apenas por regex. Todos os modelos são executados em nossos próprios servidores na Alemanha — nenhum dado é enviado para Meta, Google, Stanford ou qualquer terceiro.

Pontuação de Confiança

Cada detecção inclui uma pontuação de confiança (0,0–1,0) para decisões humanas no loop. Formatos altamente específicos (por exemplo, IBAN alemão DE89 3704 0044 0532 0130 00) pontuam 0,85+, enquanto padrões genéricos de dígitos pontuam 0,3–0,5 e dependem de palavras de contexto para confirmação. As equipes de conformidade podem revisar e substituir detecções antes da anonimização.

Análise de Palavras de Contexto

Cada reconhecedor possui palavras de contexto no idioma relevante (por exemplo, 'Personalausweis' para IDs alemães, 'kitambulisho' para IDs quenianos). Quando palavras de contexto aparecem próximas a uma correspondência, a pontuação de confiança é aumentada.

Tipos de Entidades Suportadas

Cobertura abrangente de tipos de informações pessoais em várias categorias

Identificadores Pessoais

  • Nomes de Pessoas
  • Endereços de Email
  • Números de Telefone
  • Data de Nascimento
  • Idade
  • Gênero
  • Nacionalidade

Informações Financeiras

  • Números de Cartão de Crédito
  • IBAN
  • BIC/SWIFT
  • Números de Conta Bancária
  • IDs Fiscais
  • Números de IVA

IDs Governamentais

  • Números de Segurança Social (SSN)
  • Números de ID Nacional
  • Números de Passaporte
  • Carteira de Motorista
  • IDs de Seguro de Saúde

Dados de Localização

  • Endereços
  • Cidades
  • Códigos ZIP/Postais
  • Países
  • Coordenadas GPS

Identificadores Digitais

  • Endereços IP (v4/v6)
  • Endereços MAC
  • URLs
  • Nomes de Domínio
  • IDs de Usuário

Dados de Organização

  • Nomes de Empresas
  • IDs de Organização
  • Números de Registro
  • Nomes de Departamentos

Dados Temporais

  • Datas
  • Horários
  • Intervalos de Datas
  • Carimbos de Data/Hora

Formatos Internacionais

  • ID Alemão (Personalausweis)
  • Seguro Nacional do Reino Unido
  • DNI/NIE Espanhol
  • Codice Fiscale Italiano
  • E mais de 70 formatos específicos de países

Suporte a Entidades Personalizadas

Precisa detectar padrões personalizados? Crie seus próprios tipos de entidades com padrões regex ou use nosso gerador de padrões assistido por IA.

Criação Manual de Padrões

Defina padrões regex para identificadores proprietários como IDs de funcionários internos, códigos de projetos ou números de referência personalizados.

Gerador de Padrões por IA

Descreva o que deseja detectar em linguagem simples, e nossa IA gera padrões regex otimizados para você.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Comece a Detectar PII Hoje

Experimente nosso motor de detecção gratuitamente com 200 tokens por ciclo. Não é necessário cartão de crédito.