cloak.business

Detectare PII: 320+ Tipuri de Entități

Motorul nostru de detectare combină 317 recunoașteri regex personalizate cu modele NLP pentru a identifica peste 320 de tipuri de informații personale în peste 70 de țări. Același input, același output - de fiecare dată.

Cum Funcționează Detectarea

Potrivire de Modele Regex (PII Structurat)

317 PatternRecognizers personalizate cu modele regex detectează date structurate precum ID-uri naționale, numere fiscale, pașapoarte și permise de conducere. Fiecare model folosește aserțiuni de limită pentru a preveni potrivirile false în cod sau date structurate.

Recunoaștere de Entități Nume NLP (Nume și Locații)

spaCy (25 de limbi), NER Stanza (7 limbi) și transformatoarele XLM-RoBERTa (16 limbi) detectează PII nestructurat precum nume de persoane, locații și organizații care nu pot fi capturate doar de regex. Toate modelele rulează pe serverele noastre din Germania — niciun fel de date nu sunt trimise către Meta, Google, Stanford sau orice terță parte.

Scor de Încredere

Fiecare detectare include un scor de încredere (0.0–1.0) pentru decizii umane în buclă. Formatele foarte specifice (de exemplu, IBAN german DE89 3704 0044 0532 0130 00) au un scor de 0.85+, în timp ce modelele generice de cifre au un scor de 0.3–0.5 și se bazează pe cuvinte de context pentru confirmare. Echipele de conformitate pot revizui și anula detectările înainte de anonimizare.

Analiza Cuvintelor de Context

Fiecare recunoaștere are cuvinte de context în limba relevantă (de exemplu, 'Personalausweis' pentru ID-urile germane, 'kitambulisho' pentru ID-urile kenyene). Când cuvintele de context apar lângă o potrivire, scorul de încredere este crescut.

Tipuri de Entități Suportate

Acoperire cuprinzătoare a tipurilor de informații personale pe categorii

Identificatori Personali

  • Nume de Persoane
  • Adrese de Email
  • Numere de Telefon
  • Data Nașterii
  • Vârstă
  • Gen
  • Naționalitate

Informații Financiare

  • Numere de Card de Credit
  • IBAN
  • BIC/SWIFT
  • Numere de Cont Bancar
  • ID-uri Fiscale
  • Numere TVA

ID-uri Guvernamentale

  • Numere de Securitate Socială (SSN)
  • Numere de ID Național
  • Numere de Pașaport
  • Permise de Conducere
  • ID-uri de Asigurare de Sănătate

Date de Locație

  • Adrese Stradale
  • Orașe
  • Coduri Poștale
  • Țări
  • Coordonate GPS

Identificatori Digitali

  • Adrese IP (v4/v6)
  • Adrese MAC
  • URL-uri
  • Nume de Domenii
  • ID-uri de Utilizator

Date Organizaționale

  • Nume de Companii
  • ID-uri de Organizații
  • Numere de Înregistrare
  • Nume de Departamente

Date Temporale

  • Date
  • Ore
  • Intervale de Date
  • Marcaje Temporale

Formate Internaționale

  • ID German (Personalausweis)
  • Asigurare Națională UK
  • DNI/NIE Spaniol
  • Codice Fiscale Italian
  • Și peste 70 de alte formate specifice țării

Suport pentru Entități Personalizate

Trebuie să detectați modele personalizate? Creați-vă propriile tipuri de entități cu modele regex sau folosiți generatorul nostru de modele asistat de AI.

Creare Manuală de Modele

Definiți modele regex pentru identificatori proprietari precum ID-uri interne de angajați, coduri de proiect sau numere de referință personalizate.

Generator de Modele AI

Descrieți ce doriți să detectați în limbaj simplu, iar AI-ul nostru generează pentru dvs. modele regex optimizate.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Începeți Detectarea PII Astăzi

Încercați motorul nostru de detectare gratuit cu 200 de tokenuri per ciclu. Nu este necesar card de credit.