Ugunduzi wa PII: Aina 320+ za Viumbe

Injini yetu ya ugunduzi inachanganya watambuzi 317 wa regex maalum na mifano ya NLP kutambua aina 320+ za taarifa za kibinafsi katika nchi 70+. Ingizo sawa, pato sawa - kila wakati.

Jinsi Ugunduzi Unavyofanya Kazi

Ulinganishaji wa Mifumo ya Regex (PII Iliyopangwa)

Watambuzi 317 wa Mifumo Maalum na mifumo ya regex hugundua data iliyopangwa kama vitambulisho vya kitaifa, nambari za kodi, pasi, na leseni za udereva. Kila muundo hutumia uthibitisho wa mipaka ili kuzuia mechi za uongo katika msimbo au data iliyopangwa.

Utambuzi wa Viumbe kwa Jina la NLP (Majina & Maeneo)

spaCy (lugha 25), Stanza NER (lugha 7), na XLM-RoBERTa transformers (lugha 16) hugundua PII isiyo na muundo kama majina ya watu, maeneo, na mashirika ambayo hayawezi kunaswa na regex pekee. Mifano yote inaendeshwa kwenye seva zetu wenyewe nchini Ujerumani — hakuna data inayotumwa kwa Meta, Google, Stanford, au chama chochote cha tatu.

Upimaji wa Uhakika

Kila ugunduzi unajumuisha alama ya uhakika (0.0–1.0) kwa maamuzi ya binadamu-katika-mzunguko. Miundo maalum sana (mfano, IBAN ya Kijerumani DE89 3704 0044 0532 0130 00) inapata alama 0.85+, wakati mifumo ya nambari za kawaida inapata alama 0.3–0.5 na hutegemea maneno ya muktadha kwa uthibitisho. Timu za kufuata zinaweza kukagua na kubatilisha ugunduzi kabla ya kuficha.

Uchambuzi wa Maneno ya Muktadha

Kila mtambuzi ana maneno ya muktadha katika lugha husika (mfano, 'Personalausweis' kwa vitambulisho vya Kijerumani, 'kitambulisho' kwa vitambulisho vya Kenya). Maneno ya muktadha yanapoonekana karibu na mechi, alama ya uhakika inaongezwa.

Aina za Viumbe Zinazosaidiwa

Ufunikaji kamili wa aina za taarifa za kibinafsi katika makundi

Vitambulisho vya Kibinafsi

  • Majina ya Watu
  • Anwani za Barua Pepe
  • Nambari za Simu
  • Tarehe ya Kuzaliwa
  • Umri
  • Jinsia
  • Utaifa

Taarifa za Kifedha

  • Nambari za Kadi za Mkopo
  • IBAN
  • BIC/SWIFT
  • Nambari za Akaunti za Benki
  • Vitambulisho vya Kodi
  • Nambari za VAT

Vitambulisho vya Serikali

  • Nambari za Usalama wa Jamii (SSN)
  • Nambari za Kitambulisho cha Kitaifa
  • Nambari za Pasipoti
  • Leseni za Udereva
  • Vitambulisho vya Bima ya Afya

Data ya Mahali

  • Anwani za Mtaa
  • Miji
  • Nambari za ZIP/Postal
  • Nchi
  • Viambatisho vya GPS

Vitambulisho vya Kidijitali

  • Anwani za IP (v4/v6)
  • Anwani za MAC
  • URL
  • Majina ya Domain
  • Vitambulisho vya Watumiaji

Data ya Shirika

  • Majina ya Kampuni
  • Vitambulisho vya Mashirika
  • Nambari za Usajili
  • Majina ya Idara

Data ya Muda

  • Tarehe
  • Nyakati
  • Vipindi vya Tarehe
  • Alama za Muda

Miundo ya Kimataifa

  • Kitambulisho cha Kijerumani (Personalausweis)
  • Bima ya Kitaifa ya Uingereza
  • DNI/NIE ya Kihispania
  • Codice Fiscale ya Kiitaliano
  • Na zaidi ya 70+ miundo maalum ya nchi

Msaada wa Viumbe Maalum

Unahitaji kugundua mifumo maalum? Unda aina zako za viumbe na mifumo ya regex au tumia jenereta yetu ya mifumo inayosaidiwa na AI.

Uundaji wa Mifumo ya Mwongozo

Fafanua mifumo ya regex kwa vitambulisho vya umiliki kama vitambulisho vya wafanyakazi wa ndani, nambari za miradi, au nambari za marejeo maalum.

Jenereta ya Mifumo ya AI

Eleza unachotaka kugundua kwa lugha rahisi, na AI yetu itakutengenezea mifumo ya regex iliyoboreshwa.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Anza Kugundua PII Leo

Jaribu injini yetu ya ugunduzi bure na tokeni 200 kwa mzunguko. Hakuna kadi ya mkopo inayohitajika.