Поддержка 48 языков
Полное обнаружение и анонимизация PII на всей платформе
spaCy NLP - Runs Locally (25 языков)
EnglishGermanSpanishFrenchItalianPortugueseDutchPolishRussianJapaneseChineseKoreanRomanianGreekCroatianSlovenianMacedonianSwedishDanishNorwegianFinnishUkrainianLithuanianCatalanTurkish
Stanza NER - Runs Locally (7 языков)
BulgarianHungarianHebrew (RTL)VietnameseAfrikaansArmenianBasque
XLM-RoBERTa Transformer - Runs Locally (16 языков)
Arabic (RTL)HindiCzechSlovakIndonesianThaiPersian (RTL)SerbianLatvianEstonianMalayBengaliUrdu (RTL)SwahiliTagalogIcelandic
Поддержка RTL
АрабскийИвритПерсидскийУрду
Работает на основе передового NLP
Три NLP-движка работают вместе для максимального языкового охвата
- Модели с ленивой загрузкой (макс. 5 кэшированных) для эффективности памяти
- Автоматическое определение языка
- Обработка документов на смешанных языках
- Языковые шаблоны сущностей
Country-Specific Formats
We detect PII in formats specific to each country and region.
European Formats
- German: Personalausweis, Steuer-ID, Reisepass
- French: NIR, Carte Nationale, Permis
- Italian: Codice Fiscale, Carta d'Identità
- Spanish: DNI, NIE, NIF
- Dutch: BSN, Rijbewijs
- Polish: PESEL, NIP, REGON
Asia-Pacific Formats
- Japan: My Number, Passport
- India: Aadhaar, PAN, GSTIN, Vehicle Registration
- Thailand: National ID, Tax ID, Passport
- Indonesia: NIK, NPWP, Passport
- Vietnam: CCCD, Tax Code, Passport
- Malaysia: MyKad, Tax ID, Passport
Americas, Africa & Middle East
- US: SSN, Driver's License, Passport
- UK: National Insurance, NHS Number
- Canada: SIN, Driver's License
- Australia: TFN, Medicare, ABN
- Kenya: National ID, KRA PIN, Passport
- South Africa: ID Number, Tax Number, Passport