cloak.business

Виявлення PII на 48 мовах

Виявляйте та анонімізуйте PII на 48 мовах з підтримкою рідних шаблонів. Повна підтримка RTL для арабської, івриту, перської та урду.

Підтримка 48 мов

Повне виявлення та анонімізація PII на всій платформі

spaCy NLP - Працює локально (25 мов)

АнглійськаНімецькаІспанськаФранцузькаІталійськаПортугальськаГолландськаПольськаРосійськаЯпонськаКитайськаКорейськаРумунськаГрецькаХорватськаСловенськаМакедонськаШведськаДанськаНорвезькаФінськаУкраїнськаЛитовськаКаталонськаТурецька

Stanza NER - Працює локально (7 мов)

БолгарськаУгорськаІврит (RTL)В'єтнамськаАфрикаансВірменськаБаскська

XLM-RoBERTa Transformer - Працює локально (16 мов)

Арабська (RTL)ГіндіЧеськаСловацькаІндонезійськаТайськаПерська (RTL)СербськаЛатвійськаЕстонськаМалайськаБенгальськаУрду (RTL)СуахіліТагальськаІсландська

Підтримка RTL

АрабськаІвритПерськаУрду

Працює на основі передових NLP

Три NLP-двигуни працюють разом для максимального покриття мов

  • Ліниве завантаження моделей (максимум 5 в кеші) для ефективності пам'яті
  • Автоматичне виявлення мови
  • Обробка документів з різними мовами
  • Мовно-специфічні шаблони сутностей

Формати, специфічні для країни

Ми виявляємо PII у форматах, специфічних для кожної країни та регіону.

Європейські формати

  • Німеччина: Personalausweis, Steuer-ID, Reisepass
  • Франція: NIR, Carte Nationale, Permis
  • Італія: Codice Fiscale, Carta d'Identità
  • Іспанія: DNI, NIE, NIF
  • Нідерланди: BSN, Rijbewijs
  • Польща: PESEL, NIP, REGON

Формати Азіатсько-Тихоокеанського регіону

  • Японія: My Number, Паспорт
  • Індія: Aadhaar, PAN, GSTIN, Реєстрація транспортного засобу
  • Таїланд: Національний ID, Податковий ID, Паспорт
  • Індонезія: NIK, NPWP, Паспорт
  • В'єтнам: CCCD, Податковий код, Паспорт
  • Малайзія: MyKad, Податковий ID, Паспорт

Америка, Африка та Близький Схід

  • США: SSN, Водійське посвідчення, Паспорт
  • Великобританія: Національне страхування, NHS Number
  • Канада: SIN, Водійське посвідчення
  • Австралія: TFN, Medicare, ABN
  • Кенія: Національний ID, KRA PIN, Паспорт
  • Південна Африка: ID Number, Податковий номер, Паспорт

Часті запитання

Які 48 мов підтримує cloak.business?

cloak.business підтримує африкаанс, арабську, вірменську, баскську, бенгальську, болгарську, каталонську, китайську, хорватську, чеську, данську, голландську, англійську, естонську, фінську, французьку, німецьку, грецьку, іврит, гінді, угорську, ісландську, індонезійську, італійську, японську, корейську, латвійську, литовську, македонську, малайську, норвезьку, перську, польську, португальську, румунську, російську, сербську, словацьку, словенську, іспанську, суахілі, шведську, тагальську, тайську, турецьку, українську, урду та в'єтнамську — з повною підтримкою RTL для арабської, івриту, перської та урду.

Чи працює виявлення PII однаково на всіх мовах?

Виявлення використовує два підходи: шаблонне порівняння на основі регулярних виразів для структурованих даних (ID, номери телефонів, податкові номери) та моделі NLP для неструктурованих сутностей (імена, місця). Виявлення на основі шаблонів охоплює всі 48 мов. Виявлення на основі NLP доступне для мов з навченими моделями.

Як обробляються формати ID, специфічні для країни?

cloak.business включає 317 розпізнавачів шаблонів, що охоплюють понад 70 країн. Кожен розпізнавач перевіряє специфічний формат, контрольну суму та структуру національних ID, податкових номерів, медичних ідентифікаторів та фінансових даних для цієї країни.

Чи можу я виявляти PII на кількох мовах в одному документі?

Так. cloak.business може обробляти багатомовні документи та виявляти PII на різних мовах в одному запиті. Система автоматично визначає, які мовні шаблони застосувати.

Як додати підтримку нової мови або типу сутності?

Ви можете створювати власні розпізнавачі сутностей, використовуючи шаблони регулярних виразів або списки заборон. Це дозволяє додавати ідентифікатори, специфічні для вашої галузі, або розширювати покриття на додаткові формати, які ще не включені в бібліотеку вбудованих розпізнавачів.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Анонімізуйте на будь-якій мові

Почніть з 200 безкоштовних токенів. Працює з усіма 48 мовами.