รองรับ 48 ภาษา
การตรวจจับและการทำให้ข้อมูล PII ไม่ระบุตัวตนทั่วทั้งแพลตฟอร์ม
spaCy NLP - ทำงานในเครื่อง (25 ภาษา)
Stanza NER - ทำงานในเครื่อง (7 ภาษา)
XLM-RoBERTa Transformer - ทำงานในเครื่อง (16 ภาษา)
รองรับ RTL
ขับเคลื่อนด้วย NLP ขั้นสูง
เครื่องมือ NLP สามตัวทำงานร่วมกันเพื่อครอบคลุมภาษาสูงสุด
- โมเดลที่โหลดแบบ Lazy (สูงสุด 5 โมเดลที่แคชไว้) เพื่อประสิทธิภาพการใช้หน่วยความจำ
- การตรวจจับภาษาที่เป็นอัตโนมัติ
- การประมวลผลเอกสารหลายภาษา
- รูปแบบเอนทิตีเฉพาะภาษา
รูปแบบเฉพาะประเทศ
เราตรวจจับ PII ในรูปแบบเฉพาะของแต่ละประเทศและภูมิภาค
รูปแบบยุโรป
- เยอรมัน: Personalausweis, Steuer-ID, Reisepass
- ฝรั่งเศส: NIR, Carte Nationale, Permis
- อิตาลี: Codice Fiscale, Carta d'Identità
- สเปน: DNI, NIE, NIF
- ดัตช์: BSN, Rijbewijs
- โปแลนด์: PESEL, NIP, REGON
รูปแบบเอเชียแปซิฟิก
- ญี่ปุ่น: My Number, Passport
- อินเดีย: Aadhaar, PAN, GSTIN, Vehicle Registration
- ไทย: บัตรประชาชน, เลขประจำตัวผู้เสียภาษี, หนังสือเดินทาง
- อินโดนีเซีย: NIK, NPWP, Passport
- เวียดนาม: CCCD, Tax Code, Passport
- มาเลเซีย: MyKad, Tax ID, Passport
อเมริกา, แอฟริกา & ตะวันออกกลาง
- สหรัฐอเมริกา: SSN, ใบขับขี่, Passport
- สหราชอาณาจักร: National Insurance, NHS Number
- แคนาดา: SIN, ใบขับขี่
- ออสเตรเลีย: TFN, Medicare, ABN
- เคนยา: บัตรประชาชน, KRA PIN, Passport
- แอฟริกาใต้: หมายเลขประจำตัว, หมายเลขภาษี, Passport
คำถามที่พบบ่อย
cloak.business รองรับ 48 ภาษาใดบ้าง?
cloak.business รองรับ Afrikaans, Arabic, Armenian, Basque, Bengali, Bulgarian, Catalan, Chinese, Croatian, Czech, Danish, Dutch, English, Estonian, Finnish, French, German, Greek, Hebrew, Hindi, Hungarian, Icelandic, Indonesian, Italian, Japanese, Korean, Latvian, Lithuanian, Macedonian, Malay, Norwegian, Persian, Polish, Portuguese, Romanian, Russian, Serbian, Slovak, Slovenian, Spanish, Swahili, Swedish, Tagalog, Thai, Turkish, Ukrainian, Urdu, และ Vietnamese — พร้อมการสนับสนุน RTL เต็มรูปแบบสำหรับ Arabic, Hebrew, Persian, และ Urdu
การตรวจจับ PII ทำงานเหมือนกันในทุกภาษาหรือไม่?
การตรวจจับใช้สองวิธี: การจับคู่รูปแบบ regex สำหรับข้อมูลที่มีโครงสร้าง (ID, หมายเลขโทรศัพท์, หมายเลขภาษี) และโมเดล NLP สำหรับเอนทิตีที่ไม่มีโครงสร้าง (ชื่อ, สถานที่) การตรวจจับตามรูปแบบครอบคลุมทั้ง 48 ภาษา การตรวจจับตาม NLP มีให้ในภาษาที่มีโมเดลที่ฝึกฝนแล้ว
รูปแบบ ID เฉพาะประเทศจัดการอย่างไร?
cloak.business รวมตัวจดจำรูปแบบ 317 รายการที่ครอบคลุมกว่า 70 ประเทศ แต่ละตัวจดจำจะตรวจสอบรูปแบบเฉพาะ, เช็คซัม, และโครงสร้างของ ID ประจำชาติ, หมายเลขภาษี, ตัวระบุสุขภาพ, และข้อมูลการเงินของประเทศนั้น ๆ
ฉันสามารถตรวจจับ PII ในหลายภาษาในเอกสารเดียวกันได้หรือไม่?
ได้ cloak.business สามารถประมวลผลเอกสารหลายภาษาและตรวจจับ PII ในหลายภาษาในคำขอเดียว ระบบจะระบุโดยอัตโนมัติว่าควรใช้รูปแบบภาษาที่ใด
ฉันจะเพิ่มการสนับสนุนสำหรับภาษาใหม่หรือประเภทเอนทิตีใหม่ได้อย่างไร?
คุณสามารถสร้างตัวจดจำเอนทิตีที่กำหนดเองโดยใช้รูปแบบ regex หรือรายการปฏิเสธ ซึ่งช่วยให้คุณเพิ่มตัวระบุเฉพาะโดเมนหรือขยายการครอบคลุมไปยังรูปแบบเพิ่มเติมที่ยังไม่รวมอยู่ในไลบรารีตัวจดจำในตัว
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only