PII-Erkennung in 48 Sprachen

Erkennen und anonymisieren Sie PII in 48 Sprachen mit nativer Musterunterstützung. Volle RTL-Unterstützung für Arabisch, Hebräisch, Persisch und Urdu.

48 unterstützte Sprachen

Vollständige PII-Erkennung und Anonymisierung auf der gesamten Plattform

spaCy NLP - Läuft lokal (25 Sprachen)

EnglischDeutschSpanischFranzösischItalienischPortugiesischNiederländischPolnischRussischJapanischChinesischKoreanischRumänischGriechischKroatischSlowenischMazedonischSchwedischDänischNorwegischFinnischUkrainischLitauischKatalanischTürkisch

Stanza NER - Läuft lokal (7 Sprachen)

BulgarischUngarischHebräisch (RTL)VietnamesischAfrikaansArmenischBaskisch

XLM-RoBERTa Transformer - Läuft lokal (16 Sprachen)

Arabisch (RTL)HindiTschechischSlowakischIndonesischThailändischPersisch (RTL)SerbischLettischEstnischMalaiischBengalischUrdu (RTL)SuaheliTagalogIsländisch

RTL-Unterstützung

ArabischHebräischPersischUrdu

Angetrieben von fortschrittlicher NLP

Drei NLP-Engines arbeiten zusammen für maximale Sprachabdeckung

  • Lazy-geladene Modelle (max. 5 zwischengespeichert) für Speicher-Effizienz
  • Automatische Spracherkennung
  • Verarbeitung von Dokumenten in gemischten Sprachen
  • Sprachspezifische Entitätsmuster

Länderspezifische Formate

Wir erkennen PII in länderspezifischen Formaten.

Europäische Formate

  • Deutsch: Personalausweis, Steuer-ID, Reisepass
  • Französisch: NIR, Carte Nationale, Permis
  • Italienisch: Codice Fiscale, Carta d'Identità
  • Spanisch: DNI, NIE, NIF
  • Niederländisch: BSN, Rijbewijs
  • Polnisch: PESEL, NIP, REGON

Asien-Pazifik-Formate

  • Japan: My Number, Reisepass
  • Indien: Aadhaar, PAN, GSTIN, Fahrzeugregistrierung
  • Thailand: National ID, Steuer-ID, Reisepass
  • Indonesien: NIK, NPWP, Reisepass
  • Vietnam: CCCD, Steuercode, Reisepass
  • Malaysia: MyKad, Steuer-ID, Reisepass

Amerika, Afrika & Naher Osten

  • USA: SSN, Führerschein, Reisepass
  • UK: National Insurance, NHS-Nummer
  • Kanada: SIN, Führerschein
  • Australien: TFN, Medicare, ABN
  • Kenia: National ID, KRA PIN, Reisepass
  • Südafrika: ID-Nummer, Steuernummer, Reisepass

Häufig gestellte Fragen

Welche 48 Sprachen unterstützt cloak.business?

cloak.business unterstützt Afrikaans, Arabisch, Armenisch, Baskisch, Bengalisch, Bulgarisch, Katalanisch, Chinesisch, Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Griechisch, Hebräisch, Hindi, Ungarisch, Isländisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Lettisch, Litauisch, Mazedonisch, Malaiisch, Norwegisch, Persisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Serbisch, Slowakisch, Slowenisch, Spanisch, Suaheli, Schwedisch, Tagalog, Thailändisch, Türkisch, Ukrainisch, Urdu und Vietnamesisch — mit voller RTL-Unterstützung für Arabisch, Hebräisch, Persisch und Urdu.

Funktioniert die PII-Erkennung in allen Sprachen gleich?

Die Erkennung verwendet zwei Ansätze: regex-basiertes Musterabgleich für strukturierte Daten (IDs, Telefonnummern, Steuernummern) und NLP-Modelle für unstrukturierte Entitäten (Namen, Orte). Die musterbasierte Erkennung deckt alle 48 Sprachen ab. Die NLP-basierte Erkennung ist in Sprachen mit trainierten Modellen verfügbar.

Wie werden länderspezifische ID-Formate behandelt?

cloak.business enthält 317 Mustererkenner, die über 70 Länder abdecken. Jeder Erkenner validiert das spezifische Format, die Prüfziffer und die Struktur nationaler IDs, Steuernummern, Gesundheitskennungen und Finanzdaten für dieses Land.

Kann ich PII in mehreren Sprachen innerhalb desselben Dokuments erkennen?

Ja. cloak.business kann mehrsprachige Dokumente verarbeiten und PII in verschiedenen Sprachen in einer einzigen Anfrage erkennen. Das System identifiziert automatisch, welche Sprachmuster angewendet werden sollen.

Wie füge ich Unterstützung für eine neue Sprache oder Entitätstyp hinzu?

Sie können benutzerdefinierte Entitätserkenner mit Regex-Mustern oder Ausschlusslisten erstellen. Dies ermöglicht es Ihnen, domänenspezifische Identifikatoren hinzuzufügen oder die Abdeckung auf zusätzliche Formate zu erweitern, die noch nicht in der integrierten Erkennerbibliothek enthalten sind.

Is This Right for You?

Best For

  • Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
  • Translation and localization agencies that process PII-containing content in multiple languages
  • Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
  • Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

  • Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
  • Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
  • Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

Anonymisieren Sie in jeder Sprache

Starten Sie mit 200 kostenlosen Tokens. Funktioniert mit allen 48 Sprachen.