Jinsi Ugunduzi Unavyofanya Kazi
Ulinganishaji wa Mifumo ya Regex (PII Iliyopangwa)
Watambuzi 317 wa Mifumo Maalum na mifumo ya regex hugundua data iliyopangwa kama vitambulisho vya kitaifa, nambari za kodi, pasi, na leseni za udereva. Kila muundo hutumia uthibitisho wa mipaka ili kuzuia mechi za uongo katika msimbo au data iliyopangwa.
Utambuzi wa Viumbe kwa Jina la NLP (Majina & Maeneo)
spaCy (lugha 25), Stanza NER (lugha 7), na XLM-RoBERTa transformers (lugha 16) hugundua PII isiyo na muundo kama majina ya watu, maeneo, na mashirika ambayo hayawezi kunaswa na regex pekee. Mifano yote inaendeshwa kwenye seva zetu wenyewe nchini Ujerumani — hakuna data inayotumwa kwa Meta, Google, Stanford, au chama chochote cha tatu.
Upimaji wa Uhakika
Kila ugunduzi unajumuisha alama ya uhakika (0.0–1.0) kwa maamuzi ya binadamu-katika-mzunguko. Miundo maalum sana (mfano, IBAN ya Kijerumani DE89 3704 0044 0532 0130 00) inapata alama 0.85+, wakati mifumo ya nambari za kawaida inapata alama 0.3–0.5 na hutegemea maneno ya muktadha kwa uthibitisho. Timu za kufuata zinaweza kukagua na kubatilisha ugunduzi kabla ya kuficha.
Uchambuzi wa Maneno ya Muktadha
Kila mtambuzi ana maneno ya muktadha katika lugha husika (mfano, 'Personalausweis' kwa vitambulisho vya Kijerumani, 'kitambulisho' kwa vitambulisho vya Kenya). Maneno ya muktadha yanapoonekana karibu na mechi, alama ya uhakika inaongezwa.
Aina za Viumbe Zinazosaidiwa
Ufunikaji kamili wa aina za taarifa za kibinafsi katika makundi
Vitambulisho vya Kibinafsi
- Majina ya Watu
- Anwani za Barua Pepe
- Nambari za Simu
- Tarehe ya Kuzaliwa
- Umri
- Jinsia
- Utaifa
Taarifa za Kifedha
- Nambari za Kadi za Mkopo
- IBAN
- BIC/SWIFT
- Nambari za Akaunti za Benki
- Vitambulisho vya Kodi
- Nambari za VAT
Vitambulisho vya Serikali
- Nambari za Usalama wa Jamii (SSN)
- Nambari za Kitambulisho cha Kitaifa
- Nambari za Pasipoti
- Leseni za Udereva
- Vitambulisho vya Bima ya Afya
Data ya Mahali
- Anwani za Mtaa
- Miji
- Nambari za ZIP/Postal
- Nchi
- Viambatisho vya GPS
Vitambulisho vya Kidijitali
- Anwani za IP (v4/v6)
- Anwani za MAC
- URL
- Majina ya Domain
- Vitambulisho vya Watumiaji
Data ya Shirika
- Majina ya Kampuni
- Vitambulisho vya Mashirika
- Nambari za Usajili
- Majina ya Idara
Data ya Muda
- Tarehe
- Nyakati
- Vipindi vya Tarehe
- Alama za Muda
Miundo ya Kimataifa
- Kitambulisho cha Kijerumani (Personalausweis)
- Bima ya Kitaifa ya Uingereza
- DNI/NIE ya Kihispania
- Codice Fiscale ya Kiitaliano
- Na zaidi ya 70+ miundo maalum ya nchi
Msaada wa Viumbe Maalum
Unahitaji kugundua mifumo maalum? Unda aina zako za viumbe na mifumo ya regex au tumia jenereta yetu ya mifumo inayosaidiwa na AI.
Uundaji wa Mifumo ya Mwongozo
Fafanua mifumo ya regex kwa vitambulisho vya umiliki kama vitambulisho vya wafanyakazi wa ndani, nambari za miradi, au nambari za marejeo maalum.
Jenereta ya Mifumo ya AI
Eleza unachotaka kugundua kwa lugha rahisi, na AI yetu itakutengenezea mifumo ya regex iliyoboreshwa.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient