Detekce PII: 320+ typů entit

Náš detekční engine založený na regexu identifikuje více než 50 typů osobních údajů s přesností založenou na vzorcích. Stejný vstup, stejný výstup - pokaždé.

Jak detekce funguje

Shoda vzorců

Používá pečlivě vytvořené regex vzory pro každý typ entity, což zajišťuje konzistentní a předvídatelné výsledky napříč všemi dokumenty.

NLP Named Entity Recognition (Names & Locations)

spaCy (25 languages), Stanza NER (7 languages), and XLM-RoBERTa transformers (16 languages) detect unstructured PII like person names, locations, and organizations that cannot be captured by regex alone. All models run on our own servers in Germany — no data is ever sent to Meta, Google, Stanford, or any third party.

Hodnocení důvěry

Každá detekce zahrnuje skóre důvěry (0-1) na základě síly vzoru a kontextu, což vám pomáhá filtrovat výsledky.

Povědomí o kontextu

Okolní textový kontext zlepšuje přesnost detekce, snižuje počet falešně pozitivních výsledků a zachycuje okrajové případy.

Podporované typy entit

Komplexní pokrytí typů osobních údajů napříč kategoriemi

Osobní identifikátory

  • Jména osob
  • E-mailové adresy
  • Telefonní čísla
  • Datum narození
  • Věk
  • Pohlaví
  • Národnost

Finanční informace

  • Čísla kreditních karet
  • IBAN
  • BIC/SWIFT
  • Čísla bankovních účtů
  • Daňová ID
  • Čísla DPH

Vládní ID

  • Čísla sociálního zabezpečení (SSN)
  • Čísla národních ID
  • Čísla pasů
  • Řidičský průkaz
  • ID zdravotního pojištění

Údaje o poloze

  • Ulice
  • Města
  • PSČ
  • Země
  • GPS souřadnice

Digitální identifikátory

  • IP adresy (v4/v6)
  • MAC adresy
  • URL
  • Doménová jména
  • Uživatelská ID

Údaje o organizaci

  • Názvy společností
  • ID organizací
  • Registrační čísla
  • Názvy oddělení

Časová data

  • Data
  • Časy
  • Časové intervaly
  • Časová razítka

Mezinárodní formáty

  • Německé ID (Personalausweis)
  • Britské národní pojištění
  • Španělské DNI/NIE
  • Italský Codice Fiscale
  • A více než 20 dalších formátů specifických pro země

Podpora vlastních entit

Potřebujete detekovat vlastní vzory? Vytvořte si vlastní typy entit s regex vzory nebo použijte náš generátor vzorů s asistencí AI.

Vytváření vzorů ručně

Definujte regex vzory pro proprietární identifikátory, jako jsou interní ID zaměstnanců, projektové kódy nebo vlastní referenční čísla.

Generátor vzorů AI

Popište, co chcete detekovat, v běžném jazyce, a naše AI pro vás vygeneruje optimalizované regex vzory.

Začněte detekovat PII ještě dnes

Vyzkoušejte náš detekční engine zdarma s 200 tokeny na cyklus. Není potřeba kreditní karta.