PII-Erkennung in 48 Sprachen

Erkennen und anonymisieren Sie PII in 48 Sprachen mit nativer Musterunterstützung. Volle RTL-Unterstützung für Arabisch, Hebräisch, Persisch und Urdu.

Kostenlos ausprobieren Sprachdokumentation

48 unterstützte Sprachen

Vollständige PII-Erkennung und Anonymisierung auf der gesamten Plattform

spaCy NLP - Läuft lokal (25 Sprachen)

EnglischDeutschSpanischFranzösischItalienischPortugiesischNiederländischPolnischRussischJapanischChinesischKoreanischRumänischGriechischKroatischSlowenischMazedonischSchwedischDänischNorwegischFinnischUkrainischLitauischKatalanischTürkisch

Stanza NER - Läuft lokal (7 Sprachen)

BulgarischUngarischHebräisch (RTL)VietnamesischAfrikaansArmenischBaskisch

XLM-RoBERTa Transformer - Läuft lokal (16 Sprachen)

Arabisch (RTL)HindiTschechischSlowakischIndonesischThailändischPersisch (RTL)SerbischLettischEstnischMalaiischBengalischUrdu (RTL)SuaheliTagalogIsländisch

RTL-Unterstützung

ArabischHebräischPersischUrdu

Angetrieben von fortschrittlicher NLP

Drei NLP-Engines arbeiten zusammen für maximale Sprachabdeckung

Lazy-geladene Modelle (max. 5 zwischengespeichert) für Speicher-Effizienz
Automatische Spracherkennung
Verarbeitung von Dokumenten in gemischten Sprachen
Sprachspezifische Entitätsmuster

Länderspezifische Formate

Wir erkennen PII in länderspezifischen Formaten.

Europäische Formate

Deutsch: Personalausweis, Steuer-ID, Reisepass
Französisch: NIR, Carte Nationale, Permis
Italienisch: Codice Fiscale, Carta d'Identità
Spanisch: DNI, NIE, NIF
Niederländisch: BSN, Rijbewijs
Polnisch: PESEL, NIP, REGON

Asien-Pazifik-Formate

Japan: My Number, Reisepass
Indien: Aadhaar, PAN, GSTIN, Fahrzeugregistrierung
Thailand: National ID, Steuer-ID, Reisepass
Indonesien: NIK, NPWP, Reisepass
Vietnam: CCCD, Steuercode, Reisepass
Malaysia: MyKad, Steuer-ID, Reisepass

Amerika, Afrika & Naher Osten

USA: SSN, Führerschein, Reisepass
UK: National Insurance, NHS-Nummer
Kanada: SIN, Führerschein
Australien: TFN, Medicare, ABN
Kenia: National ID, KRA PIN, Reisepass
Südafrika: ID-Nummer, Steuernummer, Reisepass

Häufig gestellte Fragen

Welche 48 Sprachen unterstützt cloak.business?

cloak.business unterstützt Afrikaans, Arabisch, Armenisch, Baskisch, Bengalisch, Bulgarisch, Katalanisch, Chinesisch, Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Griechisch, Hebräisch, Hindi, Ungarisch, Isländisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Lettisch, Litauisch, Mazedonisch, Malaiisch, Norwegisch, Persisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Serbisch, Slowakisch, Slowenisch, Spanisch, Suaheli, Schwedisch, Tagalog, Thailändisch, Türkisch, Ukrainisch, Urdu und Vietnamesisch — mit voller RTL-Unterstützung für Arabisch, Hebräisch, Persisch und Urdu.

Funktioniert die PII-Erkennung in allen Sprachen gleich?

Die Erkennung verwendet zwei Ansätze: regex-basiertes Musterabgleich für strukturierte Daten (IDs, Telefonnummern, Steuernummern) und NLP-Modelle für unstrukturierte Entitäten (Namen, Orte). Die musterbasierte Erkennung deckt alle 48 Sprachen ab. Die NLP-basierte Erkennung ist in Sprachen mit trainierten Modellen verfügbar.

Wie werden länderspezifische ID-Formate behandelt?

cloak.business enthält 317 Mustererkenner, die über 70 Länder abdecken. Jeder Erkenner validiert das spezifische Format, die Prüfziffer und die Struktur nationaler IDs, Steuernummern, Gesundheitskennungen und Finanzdaten für dieses Land.

Kann ich PII in mehreren Sprachen innerhalb desselben Dokuments erkennen?

Ja. cloak.business kann mehrsprachige Dokumente verarbeiten und PII in verschiedenen Sprachen in einer einzigen Anfrage erkennen. Das System identifiziert automatisch, welche Sprachmuster angewendet werden sollen.

Wie füge ich Unterstützung für eine neue Sprache oder Entitätstyp hinzu?

Sie können benutzerdefinierte Entitätserkenner mit Regex-Mustern oder Ausschlusslisten erstellen. Dies ermöglicht es Ihnen, domänenspezifische Identifikatoren hinzuzufügen oder die Abdeckung auf zusätzliche Formate zu erweitern, die noch nicht in der integrierten Erkennerbibliothek enthalten sind.

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonymisieren Sie in jeder Sprache

Starten Sie mit 200 kostenlosen Tokens. Funktioniert mit allen 48 Sprachen.