cloak.business

זיהוי PII ב-48 שפות

זהה ואנונימיזציה של PII ב-48 שפות עם תמיכה בדפוסים מקומיים. תמיכה מלאה ב-RTL לערבית, עברית, פרסית ואורדו.

48 שפות נתמכות

זיהוי ואנונימיזציה מלאה של PII בכל הפלטפורמה

spaCy NLP - רץ מקומית (25 שפות)

אנגליתגרמניתספרדיתצרפתיתאיטלקיתפורטוגזיתהולנדיתפולניתרוסיתיפניתסיניתקוריאניתרומניתיווניתקרואטיתסלובניתמקדוניתשוודיתדניתנורווגיתפיניתאוקראיניתליטאיתקטלאניתטורקית

Stanza NER - רץ מקומית (7 שפות)

בולגריתהונגריתעברית (RTL)וייטנאמיתאפריקאנסארמניתבסקית

XLM-RoBERTa Transformer - רץ מקומית (16 שפות)

ערבית (RTL)הינדיתצ'כיתסלובקיתאינדונזיתתאיתפרסית (RTL)סרביתלטביתאסטוניתמלאיתבנגליתאורדו (RTL)סווהיליתטגלוגאיסלנדית

תמיכה ב-RTL

ערביתעבריתפרסיתאורדו

מופעל על ידי NLP מתקדם

שלושה מנועי NLP עובדים יחד לכיסוי שפות מרבי

  • מודלים נטענים בעצלות (מקסימום 5 במטמון) ליעילות זיכרון
  • זיהוי שפה אוטומטי
  • עיבוד מסמכים רב-לשוני
  • דפוסי ישויות ספציפיים לשפה

פורמטים ספציפיים למדינה

אנו מזהים PII בפורמטים ספציפיים לכל מדינה ואזור.

פורמטים אירופיים

  • גרמנית: תעודת זהות, Steuer-ID, דרכון
  • צרפתית: NIR, Carte Nationale, רישיון
  • איטלקית: Codice Fiscale, Carta d'Identità
  • ספרדית: DNI, NIE, NIF
  • הולנדית: BSN, רישיון נהיגה
  • פולנית: PESEL, NIP, REGON

פורמטים אסיה-פסיפיק

  • יפן: My Number, דרכון
  • הודו: Aadhaar, PAN, GSTIN, רישום רכב
  • תאילנד: תעודת זהות לאומית, מספר מס, דרכון
  • אינדונזיה: NIK, NPWP, דרכון
  • וייטנאם: CCCD, קוד מס, דרכון
  • מלזיה: MyKad, מספר מס, דרכון

אמריקות, אפריקה והמזרח התיכון

  • ארה"ב: SSN, רישיון נהיגה, דרכון
  • בריטניה: ביטוח לאומי, מספר NHS
  • קנדה: SIN, רישיון נהיגה
  • אוסטרליה: TFN, Medicare, ABN
  • קניה: תעודת זהות לאומית, KRA PIN, דרכון
  • דרום אפריקה: מספר תעודת זהות, מספר מס, דרכון

שאלות נפוצות

אילו 48 שפות cloak.business תומכת?

cloak.business תומכת באפריקאנס, ערבית, ארמנית, בסקית, בנגלית, בולגרית, קטלאנית, סינית, קרואטית, צ'כית, דנית, הולנדית, אנגלית, אסטונית, פינית, צרפתית, גרמנית, יוונית, עברית, הינדית, הונגרית, איסלנדית, אינדונזית, איטלקית, יפנית, קוריאנית, לטבית, ליטאית, מקדונית, מלאית, נורווגית, פרסית, פולנית, פורטוגזית, רומנית, רוסית, סרבית, סלובקית, סלובנית, ספרדית, סווהילית, שוודית, טגלוג, תאית, טורקית, אוקראינית, אורדו ווייטנאמית — עם תמיכה מלאה ב-RTL לערבית, עברית, פרסית ואורדו.

האם זיהוי PII עובד אותו דבר בכל השפות?

הזיהוי משתמש בשתי גישות: התאמת דפוסים מבוססת רגקס לנתונים מובנים (תעודות זהות, מספרי טלפון, מספרי מס) ומודלי NLP לישויות לא מובנות (שמות, מיקומים). זיהוי מבוסס דפוסים מכסה את כל 48 השפות. זיהוי מבוסס NLP זמין בשפות עם מודלים מאומנים.

כיצד מטפלים בפורמטים של תעודות זהות ספציפיות למדינה?

cloak.business כוללת 317 מזהי דפוסים המכסים מעל 70 מדינות. כל מזהה מאמת את הפורמט הספציפי, סכום הביקורת והמבנה של תעודות זהות לאומיות, מספרי מס, מזהי בריאות ונתונים פיננסיים לאותה מדינה.

האם אני יכול לזהות PII במספר שפות באותו מסמך?

כן. cloak.business יכולה לעבד מסמכים רב-לשוניים ולזהות PII בשפות שונות בבקשה אחת. המערכת מזהה אוטומטית אילו דפוסי שפה ליישם.

כיצד אני מוסיף תמיכה לשפה חדשה או סוג ישות חדש?

אתה יכול ליצור מזהי ישויות מותאמים אישית באמצעות דפוסי רגקס או רשימות חסימה. זה מאפשר לך להוסיף מזהים ספציפיים לתחום או להרחיב את הכיסוי לפורמטים נוספים שעדיין לא נכללו בספריית המזהים המובנית.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

אנונימיזציה בכל שפה

התחל עם 200 אסימונים חינם. עובד עם כל 48 השפות.