cloak.business

Detectarea PII în 48 de Limbi

Detectați și anonimați PII în 48 de limbi cu suport nativ pentru tipare. Suport complet RTL pentru arabă, ebraică, persană și urdu.

48 de Limbi Suportate

Detectare și anonimizare completă a PII pe întreaga platformă

spaCy NLP - Rulează Local (25 de limbi)

EnglezăGermanăSpaniolăFrancezăItalianăPortughezăOlandezăPolonezăRusăJaponezăChinezăCoreeanăRomânăGreacăCroatăSlovenăMacedoneanăSuedezăDanezăNorvegianăFinlandezăUcraineanăLituanianăCatalanăTurcă

Stanza NER - Rulează Local (7 limbi)

BulgarăMaghiarăEbraică (RTL)VietnamezăAfrikaansArmeanăBască

XLM-RoBERTa Transformer - Rulează Local (16 limbi)

Arabă (RTL)HindiCehăSlovacăIndonezianăThailandezăPersană (RTL)SârbăLetonăEstonăMalayezăBengalezăUrdu (RTL)SwahiliTagalogIslandeză

Suport RTL

ArabăEbraicăPersanăUrdu

Alimentat de NLP Avansat

Trei motoare NLP care lucrează împreună pentru acoperire maximă a limbilor

  • Modele încărcate la cerere (maxim 5 memorate în cache) pentru eficiență de memorie
  • Detectare automată a limbii
  • Procesare documente multilingve
  • Tipare de entități specifice limbii

Formate Specifice Țării

Detectăm PII în formate specifice fiecărei țări și regiuni.

Formate Europene

  • Germană: Personalausweis, Steuer-ID, Reisepass
  • Franceză: NIR, Carte Nationale, Permis
  • Italiană: Codice Fiscale, Carta d'Identità
  • Spaniolă: DNI, NIE, NIF
  • Olandeză: BSN, Rijbewijs
  • Poloneză: PESEL, NIP, REGON

Formate Asia-Pacific

  • Japonia: My Number, Pașaport
  • India: Aadhaar, PAN, GSTIN, Înmatriculare Vehicul
  • Thailanda: ID Național, ID Fiscal, Pașaport
  • Indonezia: NIK, NPWP, Pașaport
  • Vietnam: CCCD, Cod Fiscal, Pașaport
  • Malaysia: MyKad, ID Fiscal, Pașaport

Americi, Africa & Orientul Mijlociu

  • SUA: SSN, Permis de Conducere, Pașaport
  • UK: Asigurare Națională, Număr NHS
  • Canada: SIN, Permis de Conducere
  • Australia: TFN, Medicare, ABN
  • Kenya: ID Național, KRA PIN, Pașaport
  • Africa de Sud: Număr ID, Număr Fiscal, Pașaport

Întrebări Frecvente

Ce 48 de limbi suportă cloak.business?

cloak.business suportă Afrikaans, Arabă, Armeană, Bască, Bengaleză, Bulgară, Catalană, Chineză, Croată, Cehă, Daneză, Olandeză, Engleză, Estonă, Finlandeză, Franceză, Germană, Greacă, Ebraică, Hindi, Maghiară, Islandeză, Indoneziană, Italiană, Japoneză, Coreeană, Letonă, Lituaniană, Macedoneană, Malayeză, Norvegiană, Persană, Poloneză, Portugheză, Română, Rusă, Sârbă, Slovacă, Slovenă, Spaniolă, Swahili, Suedeză, Tagalog, Thailandeză, Turcă, Ucraineană, Urdu și Vietnameză — cu suport complet RTL pentru Arabă, Ebraică, Persană și Urdu.

Detectarea PII funcționează la fel în toate limbile?

Detectarea folosește două abordări: potrivirea tiparelor bazate pe regex pentru date structurate (ID-uri, numere de telefon, numere fiscale) și modele NLP pentru entități nestructurate (nume, locații). Detectarea bazată pe tipare acoperă toate cele 48 de limbi. Detectarea bazată pe NLP este disponibilă în limbile cu modele antrenate.

Cum sunt gestionate formatele de ID specifice țării?

cloak.business include 317 recunoașteri de tipare care acoperă peste 70 de țări. Fiecare recunoaștere validează formatul specific, suma de control și structura ID-urilor naționale, numerelor fiscale, identificatorilor de sănătate și datelor financiare pentru acea țară.

Pot detecta PII în mai multe limbi în același document?

Da. cloak.business poate procesa documente multilingve și detecta PII în diferite limbi într-o singură cerere. Sistemul identifică automat ce tipare de limbă să aplice.

Cum adaug suport pentru o limbă nouă sau un tip de entitate?

Puteți crea recunoașteri de entități personalizate folosind tipare regex sau liste de excludere. Acest lucru vă permite să adăugați identificatori specifici domeniului sau să extindeți acoperirea la formate suplimentare care nu sunt încă incluse în biblioteca de recunoașteri încorporate.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizați în Orice Limbă

Începeți cu 200 de jetoane gratuite. Funcționează cu toate cele 48 de limbi.