PII Detekzioa 48 Hizkuntzatan

Detektatu eta anonimizatu PII 48 hizkuntzatan eredu natiboen laguntzarekin. RTL laguntza osoa arabierar, hebreer, persier eta urduerako.

48 Hizkuntza Lagunduta

PII detekzio eta anonimizazio osoa plataforma osoan

spaCy NLP - Tokian Tokiko Exekuzioa (25 hizkuntza)

IngelesaAlemanaEspainolaFrantsesaItalieraPortugesaNederlanderaPolonieraErrusieraJaponiarraTxinatarraKorearraErrumanieraGrezieraKroazieraEslovenieraMazedonieraSuedieraDaniarraNorvegieraFinlandieraUkraineraLituanieraKatalanaTurkiera

Stanza NER - Tokian Tokiko Exekuzioa (7 hizkuntza)

BulgarieraHungarieraHebreera (RTL)VietnameraAfrikaansaArmenieraEuskara

XLM-RoBERTa Transformer - Tokian Tokiko Exekuzioa (16 hizkuntza)

Arabiera (RTL)HindiaTxekieraEslovakieraIndonesieraTailandieraPersiera (RTL)SerbieraLetonieraEstonieraMalayeraBengaleraUrduera (RTL)SwahilieraTagalogIslandiera

RTL Laguntza

ArabieraHebreeraPersieraUrduera

Aurreratutako NLPk Bultzatuta

Hiru NLP motor elkarrekin hizkuntza estaldura maximoa lortzeko

  • Eredu alferkargatuak (gehienez 5 cacheatuta) memoria eraginkortasunerako
  • Hizkuntza detekzio automatikoa
  • Hizkuntza nahasiko dokumentuen prozesamendua
  • Hizkuntza espezifikoko entitate ereduak

Herrialde Espezifikoko Formatuak

PII detektatzen dugu herrialde eta eskualde bakoitzari dagozkion formatuetan.

Europako Formatuak

  • Aleman: Personalausweis, Steuer-ID, Reisepass
  • Frantses: NIR, Carte Nationale, Permis
  • Italiar: Codice Fiscale, Carta d'Identità
  • Espainiar: DNI, NIE, NIF
  • Nederlandera: BSN, Rijbewijs
  • Poloniar: PESEL, NIP, REGON

Asia-Pazifikoko Formatuak

  • Japonia: My Number, Pasaportea
  • India: Aadhaar, PAN, GSTIN, Ibilgailu Erregistroa
  • Thailandia: Nortasun Nazionala, Zerga ID, Pasaportea
  • Indonesia: NIK, NPWP, Pasaportea
  • Vietnam: CCCD, Zerga Kodea, Pasaportea
  • Malaysia: MyKad, Zerga ID, Pasaportea

Amerikak, Afrika eta Ekialde Hurbila

  • AEB: SSN, Gidabaimena, Pasaportea
  • Erresuma Batua: Gizarte Segurantza, NHS Zenbakia
  • Kanada: SIN, Gidabaimena
  • Australia: TFN, Medicare, ABN
  • Kenia: Nortasun Nazionala, KRA PIN, Pasaportea
  • Hegoafrika: ID Zenbakia, Zerga Zenbakia, Pasaportea

Ohiko Galderak

Zein 48 hizkuntza onartzen ditu cloak.business-ek?

cloak.business-ek Afrikaansa, Arabiera, Armeniera, Euskara, Bengalera, Bulgariera, Katalana, Txinatarra, Kroaziera, Txekiera, Daniarra, Nederlandera, Ingelesa, Estoniera, Finlandiera, Frantsesa, Alemana, Greziera, Hebreera, Hindia, Hungariera, Islandiera, Indonesiera, Italiera, Japoniarra, Korearra, Letoniera, Lituaniera, Mazedoniera, Malayera, Norvegiera, Persiera, Poloniera, Portugesa, Errumaniera, Errusiera, Serbiera, Eslovakiera, Esloveniera, Espainiarra, Swahiliera, Suediera, Tagalog, Tailandiera, Turkiera, Ukrainera, Urduera eta Vietnamera onartzen ditu — RTL laguntza osoa arabierar, hebreer, persier eta urduerako.

PII detekzioa berdin funtzionatzen al du hizkuntza guztietan?

Detekzioak bi hurbilketa erabiltzen ditu: regex-oinarritutako eredu bat datu egituratuetarako (IDak, telefono zenbakiak, zerga zenbakiak) eta NLP ereduak entitate egituratu gabekoetarako (izenak, kokapenak). Eredu-oinarritutako detekzioak 48 hizkuntza guztiak estaltzen ditu. NLP-oinarritutako detekzioa entrenatutako ereduak dituzten hizkuntzetan eskuragarri dago.

Nola kudeatzen dira herrialde espezifikoko ID formatuak?

cloak.business-ek 317 eredu errekonozitzaile ditu 70+ herrialde estaltzen. Errekonozitzaile bakoitzak herrialde horretako ID nazionalen, zerga zenbakien, osasun identifikatzaileen eta datu finantzarioen formatu, kontrol-batura eta egitura zehatzak balioztatzen ditu.

Dokumentu berean hizkuntza anitzetan PII detekta dezaket?

Bai. cloak.business-ek dokumentu eleanitzak prozesatu eta hizkuntza desberdinetako PII detekta dezake eskaera bakarrean. Sistemak automatikoki identifikatzen du zein hizkuntza eredu aplikatu behar diren.

Nola gehitu dezaket hizkuntza berri bat edo entitate mota berri bat?

Entitate errekonozitzaile pertsonalizatuak sor ditzakezu regex ereduak edo ukapen zerrendak erabiliz. Honek domeinu espezifikoko identifikatzaileak gehitzeko edo oraindik barneko errekonozitzaile liburutegian sartuta ez dauden formatu gehigarrietara estaldura zabaltzeko aukera ematen dizu.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonimizatu Edozein Hizkuntzatan

Hasi 200 token doan. 48 hizkuntza guztiekin funtzionatzen du.