Kako Detekcija Funkcioniše
Regex Usklađivanje Obrazaca (Strukturisani PII)
317 prilagođenih PatternRecognizers sa regex obrascima detektuje strukturisane podatke kao što su nacionalni ID-ovi, poreski brojevi, pasoši i vozačke dozvole. Svaki obrazac koristi granične tvrdnje da spreči lažna poklapanja u kodu ili strukturisanim podacima.
NLP Prepoznavanje Imenovanih Entiteta (Imena i Lokacije)
spaCy (25 jezika), Stanza NER (7 jezika) i XLM-RoBERTa transformeri (16 jezika) detektuju nestrukturisani PII kao što su imena osoba, lokacije i organizacije koje se ne mogu uhvatiti samo regex-om. Svi modeli rade na našim serverima u Nemačkoj — podaci se nikada ne šalju Meta, Google, Stanfordu ili bilo kojoj trećoj strani.
Skoriranje Pouzdanosti
Svaka detekcija uključuje skor pouzdanosti (0.0–1.0) za odluke sa ljudskim učešćem. Visoko specifični formati (npr. nemački IBAN DE89 3704 0044 0532 0130 00) dobijaju skor 0.85+, dok generički obrasci brojeva dobijaju skor 0.3–0.5 i oslanjaju se na kontekstualne reči za potvrdu. Timovi za usklađenost mogu pregledati i prepraviti detekcije pre anonimizacije.
Analiza Kontekstualnih Reči
Svaki prepoznavač ima kontekstualne reči na relevantnom jeziku (npr. 'Personalausweis' za nemačke ID-ove, 'kitambulisho' za kenijske ID-ove). Kada se kontekstualne reči pojave blizu poklapanja, skor pouzdanosti se povećava.
Podržani Tipovi Entiteta
Sveobuhvatna pokrivenost tipova ličnih informacija po kategorijama
Lični Identifikatori
- Imena Osoba
- Email Adrese
- Brojevi Telefona
- Datum Rođenja
- Starost
- Pol
- Nacionalnost
Finansijske Informacije
- Brojevi Kreditnih Kartica
- IBAN
- BIC/SWIFT
- Brojevi Bankovnih Računa
- Poreski ID-ovi
- PDV Brojevi
Vladini ID-ovi
- Brojevi Socijalnog Osiguranja (SSN)
- Nacionalni ID Brojevi
- Brojevi Pasoša
- Vozačke Dozvole
- ID-ovi Zdravstvenog Osiguranja
Podaci o Lokaciji
- Adrese Ulica
- Gradovi
- Poštanski Brojevi
- Države
- GPS Koordinate
Digitalni Identifikatori
- IP Adrese (v4/v6)
- MAC Adrese
- URL-ovi
- Domeni
- Korisnički ID-ovi
Podaci o Organizaciji
- Imena Kompanija
- ID-ovi Organizacija
- Registracioni Brojevi
- Imena Odeljenja
Vremenski Podaci
- Datumi
- Vremena
- Vremenski Rasponi
- Vremenske Oznake
Međunarodni Formati
- Nemački ID (Personalausweis)
- UK Nacionalno Osiguranje
- Španski DNI/NIE
- Italijanski Codice Fiscale
- I još 70+ formata specifičnih za zemlju
Podrška za Prilagođene Entitete
Trebate detektovati prilagođene obrasce? Kreirajte sopstvene tipove entiteta sa regex obrascima ili koristite naš AI generator obrazaca.
Ručno Kreiranje Obrazaca
Definišite regex obrasce za vlasničke identifikatore kao što su interni ID-ovi zaposlenih, kodovi projekata ili prilagođeni referentni brojevi.
AI Generator Obrazaca
Opišite šta želite da detektujete običnim jezikom, a naš AI će generisati optimizovane regex obrasce za vas.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient