Como Funciona a Detecção
Correspondência de Padrões Regex (PII Estruturado)
317 PatternRecognizers personalizados com padrões regex detectam dados estruturados como IDs nacionais, números fiscais, passaportes e carteiras de motorista. Cada padrão usa afirmações de limite para evitar correspondências falsas em código ou dados estruturados.
Reconhecimento de Entidades Nomeadas por NLP (Nomes e Localizações)
spaCy (25 idiomas), NER Stanza (7 idiomas) e transformadores XLM-RoBERTa (16 idiomas) detectam PII não estruturado como nomes de pessoas, localizações e organizações que não podem ser capturados apenas por regex. Todos os modelos são executados em nossos próprios servidores na Alemanha — nenhum dado é enviado para Meta, Google, Stanford ou qualquer terceiro.
Pontuação de Confiança
Cada detecção inclui uma pontuação de confiança (0,0–1,0) para decisões humanas no loop. Formatos altamente específicos (por exemplo, IBAN alemão DE89 3704 0044 0532 0130 00) pontuam 0,85+, enquanto padrões genéricos de dígitos pontuam 0,3–0,5 e dependem de palavras de contexto para confirmação. As equipes de conformidade podem revisar e substituir detecções antes da anonimização.
Análise de Palavras de Contexto
Cada reconhecedor possui palavras de contexto no idioma relevante (por exemplo, 'Personalausweis' para IDs alemães, 'kitambulisho' para IDs quenianos). Quando palavras de contexto aparecem próximas a uma correspondência, a pontuação de confiança é aumentada.
Tipos de Entidades Suportadas
Cobertura abrangente de tipos de informações pessoais em várias categorias
Identificadores Pessoais
- Nomes de Pessoas
- Endereços de Email
- Números de Telefone
- Data de Nascimento
- Idade
- Gênero
- Nacionalidade
Informações Financeiras
- Números de Cartão de Crédito
- IBAN
- BIC/SWIFT
- Números de Conta Bancária
- IDs Fiscais
- Números de IVA
IDs Governamentais
- Números de Segurança Social (SSN)
- Números de ID Nacional
- Números de Passaporte
- Carteira de Motorista
- IDs de Seguro de Saúde
Dados de Localização
- Endereços
- Cidades
- Códigos ZIP/Postais
- Países
- Coordenadas GPS
Identificadores Digitais
- Endereços IP (v4/v6)
- Endereços MAC
- URLs
- Nomes de Domínio
- IDs de Usuário
Dados de Organização
- Nomes de Empresas
- IDs de Organização
- Números de Registro
- Nomes de Departamentos
Dados Temporais
- Datas
- Horários
- Intervalos de Datas
- Carimbos de Data/Hora
Formatos Internacionais
- ID Alemão (Personalausweis)
- Seguro Nacional do Reino Unido
- DNI/NIE Espanhol
- Codice Fiscale Italiano
- E mais de 70 formatos específicos de países
Suporte a Entidades Personalizadas
Precisa detectar padrões personalizados? Crie seus próprios tipos de entidades com padrões regex ou use nosso gerador de padrões assistido por IA.
Criação Manual de Padrões
Defina padrões regex para identificadores proprietários como IDs de funcionários internos, códigos de projetos ou números de referência personalizados.
Gerador de Padrões por IA
Descreva o que deseja detectar em linguagem simples, e nossa IA gera padrões regex otimizados para você.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient