48 unterstützte Sprachen
Vollständige PII-Erkennung und Anonymisierung auf der gesamten Plattform
spaCy NLP - Läuft lokal (25 Sprachen)
Stanza NER - Läuft lokal (7 Sprachen)
XLM-RoBERTa Transformer - Läuft lokal (16 Sprachen)
RTL-Unterstützung
Angetrieben von fortschrittlicher NLP
Drei NLP-Engines arbeiten zusammen für maximale Sprachabdeckung
- Lazy-geladene Modelle (max. 5 zwischengespeichert) für Speicher-Effizienz
- Automatische Spracherkennung
- Verarbeitung von Dokumenten in gemischten Sprachen
- Sprachspezifische Entitätsmuster
Länderspezifische Formate
Wir erkennen PII in länderspezifischen Formaten.
Europäische Formate
- Deutsch: Personalausweis, Steuer-ID, Reisepass
- Französisch: NIR, Carte Nationale, Permis
- Italienisch: Codice Fiscale, Carta d'Identità
- Spanisch: DNI, NIE, NIF
- Niederländisch: BSN, Rijbewijs
- Polnisch: PESEL, NIP, REGON
Asien-Pazifik-Formate
- Japan: My Number, Reisepass
- Indien: Aadhaar, PAN, GSTIN, Fahrzeugregistrierung
- Thailand: National ID, Steuer-ID, Reisepass
- Indonesien: NIK, NPWP, Reisepass
- Vietnam: CCCD, Steuercode, Reisepass
- Malaysia: MyKad, Steuer-ID, Reisepass
Amerika, Afrika & Naher Osten
- USA: SSN, Führerschein, Reisepass
- UK: National Insurance, NHS-Nummer
- Kanada: SIN, Führerschein
- Australien: TFN, Medicare, ABN
- Kenia: National ID, KRA PIN, Reisepass
- Südafrika: ID-Nummer, Steuernummer, Reisepass
Häufig gestellte Fragen
Welche 48 Sprachen unterstützt cloak.business?
cloak.business unterstützt Afrikaans, Arabisch, Armenisch, Baskisch, Bengalisch, Bulgarisch, Katalanisch, Chinesisch, Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Griechisch, Hebräisch, Hindi, Ungarisch, Isländisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Lettisch, Litauisch, Mazedonisch, Malaiisch, Norwegisch, Persisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Serbisch, Slowakisch, Slowenisch, Spanisch, Suaheli, Schwedisch, Tagalog, Thailändisch, Türkisch, Ukrainisch, Urdu und Vietnamesisch — mit voller RTL-Unterstützung für Arabisch, Hebräisch, Persisch und Urdu.
Funktioniert die PII-Erkennung in allen Sprachen gleich?
Die Erkennung verwendet zwei Ansätze: regex-basiertes Musterabgleich für strukturierte Daten (IDs, Telefonnummern, Steuernummern) und NLP-Modelle für unstrukturierte Entitäten (Namen, Orte). Die musterbasierte Erkennung deckt alle 48 Sprachen ab. Die NLP-basierte Erkennung ist in Sprachen mit trainierten Modellen verfügbar.
Wie werden länderspezifische ID-Formate behandelt?
cloak.business enthält 317 Mustererkenner, die über 70 Länder abdecken. Jeder Erkenner validiert das spezifische Format, die Prüfziffer und die Struktur nationaler IDs, Steuernummern, Gesundheitskennungen und Finanzdaten für dieses Land.
Kann ich PII in mehreren Sprachen innerhalb desselben Dokuments erkennen?
Ja. cloak.business kann mehrsprachige Dokumente verarbeiten und PII in verschiedenen Sprachen in einer einzigen Anfrage erkennen. Das System identifiziert automatisch, welche Sprachmuster angewendet werden sollen.
Wie füge ich Unterstützung für eine neue Sprache oder Entitätstyp hinzu?
Sie können benutzerdefinierte Entitätserkenner mit Regex-Mustern oder Ausschlusslisten erstellen. Dies ermöglicht es Ihnen, domänenspezifische Identifikatoren hinzuzufügen oder die Abdeckung auf zusätzliche Formate zu erweitern, die noch nicht in der integrierten Erkennerbibliothek enthalten sind.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only