Paano Gumagana ang Pagtuklas
Pattern Matching
Gumagamit ng maingat na nilikhang regex patterns para sa bawat uri ng entidad, na tinitiyak ang pare-pareho at mahuhulaan na mga resulta sa lahat ng dokumento.
NLP Named Entity Recognition (Names & Locations)
spaCy (25 languages), Stanza NER (7 languages), and XLM-RoBERTa transformers (16 languages) detect unstructured PII like person names, locations, and organizations that cannot be captured by regex alone. All models run on our own servers in Germany — no data is ever sent to Meta, Google, Stanford, or any third party.
Confidence Scoring
Bawat pagtuklas ay may kasamang confidence score (0-1) batay sa lakas ng pattern at konteksto, na tumutulong sa iyo na salain ang mga resulta.
Pagkaalam sa Konteksto
Ang nakapaligid na konteksto ng teksto ay nagpapabuti sa katumpakan ng pagtuklas, binabawasan ang mga maling positibo habang nahuhuli ang mga edge case.
Mga Suportadong Uri ng Entidad
Komprehensibong saklaw ng mga uri ng personal na impormasyon sa iba't ibang kategorya
Personal na Tagapagkilala
- Mga Pangalan ng Tao
- Mga Email Address
- Mga Numero ng Telepono
- Petsa ng Kapanganakan
- Edad
- Kasarian
- Nasyonalidad
Impormasyon sa Pananalapi
- Mga Numero ng Credit Card
- IBAN
- BIC/SWIFT
- Mga Numero ng Bank Account
- Tax IDs
- VAT Numbers
Mga ID ng Gobyerno
- Mga Numero ng Social Security (SSN)
- Mga National ID Numbers
- Mga Numero ng Pasaporte
- Lisensya ng Driver
- Mga ID ng Seguro sa Kalusugan
Data ng Lokasyon
- Mga Address ng Kalye
- Mga Lungsod
- ZIP/Postal Codes
- Mga Bansa
- GPS Coordinates
Digital na Tagapagkilala
- Mga IP Address (v4/v6)
- Mga MAC Address
- Mga URL
- Mga Pangalan ng Domain
- Mga User ID
Data ng Organisasyon
- Mga Pangalan ng Kumpanya
- Mga ID ng Organisasyon
- Mga Numero ng Rehistro
- Mga Pangalan ng Departamento
Temporal na Data
- Mga Petsa
- Mga Oras
- Mga Saklaw ng Petsa
- Mga Timestamps
Internasyonal na Mga Format
- German ID (Personalausweis)
- UK National Insurance
- Spanish DNI/NIE
- Italian Codice Fiscale
- At higit sa 20 iba pang mga partikular na format ng bansa
Suporta sa Custom na Entidad
Kailangan bang tuklasin ang mga custom na pattern? Lumikha ng sarili mong mga uri ng entidad gamit ang regex patterns o gamitin ang aming AI-assisted pattern generator.
Manwal na Paglikha ng Pattern
Tukuyin ang mga regex pattern para sa mga proprietary identifier tulad ng mga internal employee ID, project codes, o custom reference numbers.
AI Pattern Generator
Ilarawan kung ano ang nais mong tuklasin sa simpleng wika, at ang aming AI ay bumubuo ng mga optimized regex pattern para sa iyo.