PII-detektion på 48 språk

Upptäck och anonymisera PII på 48 språk med stöd för inhemska mönster. Fullt RTL-stöd för arabiska, hebreiska, persiska och urdu.

Prova gratis Språkdokumentation

48 språk stöds

Full PII-detektion och anonymisering över hela plattformen

spaCy NLP - Körs lokalt (25 språk)

EngelskaTyskaSpanskaFranskaItalienskaPortugisiskaNederländskaPolskaRyskaJapanskaKinesiskaKoreanskaRumänskaGrekiskaKroatiskaSlovenskaMakedonskaSvenskaDanskaNorskaFinskaUkrainskaLitauiskaKatalanskaTurkiska

Stanza NER - Körs lokalt (7 språk)

BulgariskaUngerskaHebreiska (RTL)VietnamesiskaAfrikaansArmeniskaBaskiska

XLM-RoBERTa Transformer - Körs lokalt (16 språk)

Arabiska (RTL)HindiTjeckiskaSlovakiskaIndonesiskaThailändskaPersiska (RTL)SerbiskaLettiskaEstniskaMalajiskaBengaliUrdu (RTL)SwahiliTagalogIsländska

RTL-stöd

ArabiskaHebreiskaPersiskaUrdu

Drivs av avancerad NLP

Tre NLP-motorer som arbetar tillsammans för maximal språktäckning

Lazy-loaded modeller (max 5 cachade) för minneseffektivitet
Automatisk språkdetektion
Blandat språkbehandling i dokument
Språksspecifika entity-mönster

Landspecifika format

Vi detekterar PII i format specifika för varje land och region.

Europeiska format

Tyska: Personalausweis, Steuer-ID, Reisepass
Franska: NIR, Carte Nationale, Permis
Italienska: Codice Fiscale, Carta d'Identità
Spanska: DNI, NIE, NIF
Nederländska: BSN, Rijbewijs
Polska: PESEL, NIP, REGON

Asien-Stillahavsformat

Japan: My Number, Pass
Indien: Aadhaar, PAN, GSTIN, Fordonsregistrering
Thailand: Nationellt ID, Skatte-ID, Pass
Indonesien: NIK, NPWP, Pass
Vietnam: CCCD, Skattekod, Pass
Malaysia: MyKad, Skatte-ID, Pass

Amerika, Afrika & Mellanöstern

USA: SSN, Körkort, Pass
Storbritannien: National Insurance, NHS-nummer
Kanada: SIN, Körkort
Australien: TFN, Medicare, ABN
Kenya: Nationellt ID, KRA PIN, Pass
Sydafrika: ID-nummer, Skattenummer, Pass

Vanliga frågor

Vilka 48 språk stöder cloak.business?

cloak.business stöder afrikaans, arabiska, armeniska, baskiska, bengali, bulgariska, katalanska, kinesiska, kroatiska, tjeckiska, danska, nederländska, engelska, estniska, finska, franska, tyska, grekiska, hebreiska, hindi, ungerska, isländska, indonesiska, italienska, japanska, koreanska, lettiska, litauiska, makedonska, malajiska, norska, persiska, polska, portugisiska, rumänska, ryska, serbiska, slovakiska, slovenska, spanska, swahili, svenska, tagalog, thailändska, turkiska, ukrainska, urdu och vietnamesiska — med fullt RTL-stöd för arabiska, hebreiska, persiska och urdu.

Fungerar PII-detektion likadant på alla språk?

Detektion använder två metoder: regex-baserad mönstermatchning för strukturerad data (ID, telefonnummer, skattenummer) och NLP-modeller för ostrukturerade entiteter (namn, platser). Mönsterbaserad detektion täcker alla 48 språk. NLP-baserad detektion är tillgänglig på språk med tränade modeller.

Hur hanteras landspecifika ID-format?

cloak.business inkluderar 317 mönsterigenkännare som täcker 70+ länder. Varje igenkännare validerar det specifika formatet, checksumman och strukturen för nationella ID, skattenummer, hälsoidentifierare och finansiella data för det landet.

Kan jag detektera PII på flera språk inom samma dokument?

Ja. cloak.business kan bearbeta flerspråkiga dokument och detektera PII över olika språk i en enda förfrågan. Systemet identifierar automatiskt vilka språk mönster som ska tillämpas.

Hur lägger jag till stöd för ett nytt språk eller entitetstyp?

Du kan skapa anpassade entity-igenkännare med regex-mönster eller nekandelistor. Detta gör att du kan lägga till domänspecifika identifierare eller utöka täckningen till ytterligare format som ännu inte ingår i det inbyggda igenkänningsbiblioteket.

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonymisera på vilket språk som helst

Börja med 200 gratis tokens. Fungerar med alla 48 språk.