48 שפות נתמכות
זיהוי ואנונימיזציה מלאה של PII בכל הפלטפורמה
spaCy NLP - רץ מקומית (25 שפות)
Stanza NER - רץ מקומית (7 שפות)
XLM-RoBERTa Transformer - רץ מקומית (16 שפות)
תמיכה ב-RTL
מופעל על ידי NLP מתקדם
שלושה מנועי NLP עובדים יחד לכיסוי שפות מרבי
- מודלים נטענים בעצלות (מקסימום 5 במטמון) ליעילות זיכרון
- זיהוי שפה אוטומטי
- עיבוד מסמכים רב-לשוני
- דפוסי ישויות ספציפיים לשפה
פורמטים ספציפיים למדינה
אנו מזהים PII בפורמטים ספציפיים לכל מדינה ואזור.
פורמטים אירופיים
- גרמנית: תעודת זהות, Steuer-ID, דרכון
- צרפתית: NIR, Carte Nationale, רישיון
- איטלקית: Codice Fiscale, Carta d'Identità
- ספרדית: DNI, NIE, NIF
- הולנדית: BSN, רישיון נהיגה
- פולנית: PESEL, NIP, REGON
פורמטים אסיה-פסיפיק
- יפן: My Number, דרכון
- הודו: Aadhaar, PAN, GSTIN, רישום רכב
- תאילנד: תעודת זהות לאומית, מספר מס, דרכון
- אינדונזיה: NIK, NPWP, דרכון
- וייטנאם: CCCD, קוד מס, דרכון
- מלזיה: MyKad, מספר מס, דרכון
אמריקות, אפריקה והמזרח התיכון
- ארה"ב: SSN, רישיון נהיגה, דרכון
- בריטניה: ביטוח לאומי, מספר NHS
- קנדה: SIN, רישיון נהיגה
- אוסטרליה: TFN, Medicare, ABN
- קניה: תעודת זהות לאומית, KRA PIN, דרכון
- דרום אפריקה: מספר תעודת זהות, מספר מס, דרכון
שאלות נפוצות
אילו 48 שפות cloak.business תומכת?
cloak.business תומכת באפריקאנס, ערבית, ארמנית, בסקית, בנגלית, בולגרית, קטלאנית, סינית, קרואטית, צ'כית, דנית, הולנדית, אנגלית, אסטונית, פינית, צרפתית, גרמנית, יוונית, עברית, הינדית, הונגרית, איסלנדית, אינדונזית, איטלקית, יפנית, קוריאנית, לטבית, ליטאית, מקדונית, מלאית, נורווגית, פרסית, פולנית, פורטוגזית, רומנית, רוסית, סרבית, סלובקית, סלובנית, ספרדית, סווהילית, שוודית, טגלוג, תאית, טורקית, אוקראינית, אורדו ווייטנאמית — עם תמיכה מלאה ב-RTL לערבית, עברית, פרסית ואורדו.
האם זיהוי PII עובד אותו דבר בכל השפות?
הזיהוי משתמש בשתי גישות: התאמת דפוסים מבוססת רגקס לנתונים מובנים (תעודות זהות, מספרי טלפון, מספרי מס) ומודלי NLP לישויות לא מובנות (שמות, מיקומים). זיהוי מבוסס דפוסים מכסה את כל 48 השפות. זיהוי מבוסס NLP זמין בשפות עם מודלים מאומנים.
כיצד מטפלים בפורמטים של תעודות זהות ספציפיות למדינה?
cloak.business כוללת 317 מזהי דפוסים המכסים מעל 70 מדינות. כל מזהה מאמת את הפורמט הספציפי, סכום הביקורת והמבנה של תעודות זהות לאומיות, מספרי מס, מזהי בריאות ונתונים פיננסיים לאותה מדינה.
האם אני יכול לזהות PII במספר שפות באותו מסמך?
כן. cloak.business יכולה לעבד מסמכים רב-לשוניים ולזהות PII בשפות שונות בבקשה אחת. המערכת מזהה אוטומטית אילו דפוסי שפה ליישם.
כיצד אני מוסיף תמיכה לשפה חדשה או סוג ישות חדש?
אתה יכול ליצור מזהי ישויות מותאמים אישית באמצעות דפוסי רגקס או רשימות חסימה. זה מאפשר לך להוסיף מזהים ספציפיים לתחום או להרחיב את הכיסוי לפורמטים נוספים שעדיין לא נכללו בספריית המזהים המובנית.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only