การตรวจจับ PII ใน 48 ภาษา

ตรวจจับและทำให้ข้อมูล PII ไม่ระบุตัวตนใน 48 ภาษาพร้อมการสนับสนุนรูปแบบพื้นเมือง รองรับ RTL สำหรับภาษาอาหรับ ฮีบรู เปอร์เซีย และอูรดู

ลองใช้ฟรี เอกสารภาษา

รองรับ 48 ภาษา

การตรวจจับและการทำให้ข้อมูล PII ไม่ระบุตัวตนทั่วทั้งแพลตฟอร์ม

spaCy NLP - ทำงานในเครื่อง (25 ภาษา)

EnglishGermanSpanishFrenchItalianPortugueseDutchPolishRussianJapaneseChineseKoreanRomanianGreekCroatianSlovenianMacedonianSwedishDanishNorwegianFinnishUkrainianLithuanianCatalanTurkish

Stanza NER - ทำงานในเครื่อง (7 ภาษา)

BulgarianHungarianHebrew (RTL)VietnameseAfrikaansArmenianBasque

XLM-RoBERTa Transformer - ทำงานในเครื่อง (16 ภาษา)

Arabic (RTL)HindiCzechSlovakIndonesianThaiPersian (RTL)SerbianLatvianEstonianMalayBengaliUrdu (RTL)SwahiliTagalogIcelandic

รองรับ RTL

ArabicHebrewPersianUrdu

ขับเคลื่อนด้วย NLP ขั้นสูง

เครื่องมือ NLP สามตัวทำงานร่วมกันเพื่อครอบคลุมภาษาสูงสุด

โมเดลที่โหลดแบบ Lazy (สูงสุด 5 โมเดลที่แคชไว้) เพื่อประสิทธิภาพการใช้หน่วยความจำ
การตรวจจับภาษาที่เป็นอัตโนมัติ
การประมวลผลเอกสารหลายภาษา
รูปแบบเอนทิตีเฉพาะภาษา

รูปแบบเฉพาะประเทศ

เราตรวจจับ PII ในรูปแบบเฉพาะของแต่ละประเทศและภูมิภาค

รูปแบบยุโรป

เยอรมัน: Personalausweis, Steuer-ID, Reisepass
ฝรั่งเศส: NIR, Carte Nationale, Permis
อิตาลี: Codice Fiscale, Carta d'Identità
สเปน: DNI, NIE, NIF
ดัตช์: BSN, Rijbewijs
โปแลนด์: PESEL, NIP, REGON

รูปแบบเอเชียแปซิฟิก

ญี่ปุ่น: My Number, Passport
อินเดีย: Aadhaar, PAN, GSTIN, Vehicle Registration
ไทย: บัตรประชาชน, เลขประจำตัวผู้เสียภาษี, หนังสือเดินทาง
อินโดนีเซีย: NIK, NPWP, Passport
เวียดนาม: CCCD, Tax Code, Passport
มาเลเซีย: MyKad, Tax ID, Passport

อเมริกา, แอฟริกา & ตะวันออกกลาง

สหรัฐอเมริกา: SSN, ใบขับขี่, Passport
สหราชอาณาจักร: National Insurance, NHS Number
แคนาดา: SIN, ใบขับขี่
ออสเตรเลีย: TFN, Medicare, ABN
เคนยา: บัตรประชาชน, KRA PIN, Passport
แอฟริกาใต้: หมายเลขประจำตัว, หมายเลขภาษี, Passport

คำถามที่พบบ่อย

cloak.business รองรับ 48 ภาษาใดบ้าง?

cloak.business รองรับ Afrikaans, Arabic, Armenian, Basque, Bengali, Bulgarian, Catalan, Chinese, Croatian, Czech, Danish, Dutch, English, Estonian, Finnish, French, German, Greek, Hebrew, Hindi, Hungarian, Icelandic, Indonesian, Italian, Japanese, Korean, Latvian, Lithuanian, Macedonian, Malay, Norwegian, Persian, Polish, Portuguese, Romanian, Russian, Serbian, Slovak, Slovenian, Spanish, Swahili, Swedish, Tagalog, Thai, Turkish, Ukrainian, Urdu, และ Vietnamese — พร้อมการสนับสนุน RTL เต็มรูปแบบสำหรับ Arabic, Hebrew, Persian, และ Urdu

การตรวจจับ PII ทำงานเหมือนกันในทุกภาษาหรือไม่?

การตรวจจับใช้สองวิธี: การจับคู่รูปแบบ regex สำหรับข้อมูลที่มีโครงสร้าง (ID, หมายเลขโทรศัพท์, หมายเลขภาษี) และโมเดล NLP สำหรับเอนทิตีที่ไม่มีโครงสร้าง (ชื่อ, สถานที่) การตรวจจับตามรูปแบบครอบคลุมทั้ง 48 ภาษา การตรวจจับตาม NLP มีให้ในภาษาที่มีโมเดลที่ฝึกฝนแล้ว

รูปแบบ ID เฉพาะประเทศจัดการอย่างไร?

cloak.business รวมตัวจดจำรูปแบบ 317 รายการที่ครอบคลุมกว่า 70 ประเทศ แต่ละตัวจดจำจะตรวจสอบรูปแบบเฉพาะ, เช็คซัม, และโครงสร้างของ ID ประจำชาติ, หมายเลขภาษี, ตัวระบุสุขภาพ, และข้อมูลการเงินของประเทศนั้น ๆ

ฉันสามารถตรวจจับ PII ในหลายภาษาในเอกสารเดียวกันได้หรือไม่?

ได้ cloak.business สามารถประมวลผลเอกสารหลายภาษาและตรวจจับ PII ในหลายภาษาในคำขอเดียว ระบบจะระบุโดยอัตโนมัติว่าควรใช้รูปแบบภาษาที่ใด

ฉันจะเพิ่มการสนับสนุนสำหรับภาษาใหม่หรือประเภทเอนทิตีใหม่ได้อย่างไร?

คุณสามารถสร้างตัวจดจำเอนทิตีที่กำหนดเองโดยใช้รูปแบบ regex หรือรายการปฏิเสธ ซึ่งช่วยให้คุณเพิ่มตัวระบุเฉพาะโดเมนหรือขยายการครอบคลุมไปยังรูปแบบเพิ่มเติมที่ยังไม่รวมอยู่ในไลบรารีตัวจดจำในตัว

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

ทำให้ไม่ระบุตัวตนในทุกภาษา

เริ่มต้นด้วยโทเค็นฟรี 200 โทเค็น ใช้งานได้กับทั้ง 48 ภาษา