Jak detekce funguje
Shoda vzorců
Používá pečlivě vytvořené regex vzory pro každý typ entity, což zajišťuje konzistentní a předvídatelné výsledky napříč všemi dokumenty.
NLP Named Entity Recognition (Names & Locations)
spaCy (25 languages), Stanza NER (7 languages), and XLM-RoBERTa transformers (16 languages) detect unstructured PII like person names, locations, and organizations that cannot be captured by regex alone. All models run on our own servers in Germany — no data is ever sent to Meta, Google, Stanford, or any third party.
Hodnocení důvěry
Každá detekce zahrnuje skóre důvěry (0-1) na základě síly vzoru a kontextu, což vám pomáhá filtrovat výsledky.
Povědomí o kontextu
Okolní textový kontext zlepšuje přesnost detekce, snižuje počet falešně pozitivních výsledků a zachycuje okrajové případy.
Podporované typy entit
Komplexní pokrytí typů osobních údajů napříč kategoriemi
Osobní identifikátory
- Jména osob
- E-mailové adresy
- Telefonní čísla
- Datum narození
- Věk
- Pohlaví
- Národnost
Finanční informace
- Čísla kreditních karet
- IBAN
- BIC/SWIFT
- Čísla bankovních účtů
- Daňová ID
- Čísla DPH
Vládní ID
- Čísla sociálního zabezpečení (SSN)
- Čísla národních ID
- Čísla pasů
- Řidičský průkaz
- ID zdravotního pojištění
Údaje o poloze
- Ulice
- Města
- PSČ
- Země
- GPS souřadnice
Digitální identifikátory
- IP adresy (v4/v6)
- MAC adresy
- URL
- Doménová jména
- Uživatelská ID
Údaje o organizaci
- Názvy společností
- ID organizací
- Registrační čísla
- Názvy oddělení
Časová data
- Data
- Časy
- Časové intervaly
- Časová razítka
Mezinárodní formáty
- Německé ID (Personalausweis)
- Britské národní pojištění
- Španělské DNI/NIE
- Italský Codice Fiscale
- A více než 20 dalších formátů specifických pro země
Podpora vlastních entit
Potřebujete detekovat vlastní vzory? Vytvořte si vlastní typy entit s regex vzory nebo použijte náš generátor vzorů s asistencí AI.
Vytváření vzorů ručně
Definujte regex vzory pro proprietární identifikátory, jako jsou interní ID zaměstnanců, projektové kódy nebo vlastní referenční čísla.
Generátor vzorů AI
Popište, co chcete detekovat, v běžném jazyce, a naše AI pro vás vygeneruje optimalizované regex vzory.