Wie die Erkennung funktioniert
Mustererkennung
Verwendet sorgfältig ausgearbeitete regex-Muster für jeden Entitätstyp und gewährleistet konsistente und vorhersehbare Ergebnisse in allen Dokumenten.
NLP Named Entity Recognition (Names & Locations)
spaCy (25 languages), Stanza NER (7 languages), and XLM-RoBERTa transformers (16 languages) detect unstructured PII like person names, locations, and organizations that cannot be captured by regex alone. All models run on our own servers in Germany — no data is ever sent to Meta, Google, Stanford, or any third party.
Vertrauensbewertung
Jede Erkennung enthält einen Vertrauensscore (0-1), basierend auf der Musterstärke und dem Kontext, der Ihnen hilft, Ergebnisse zu filtern.
Kontextbewusstsein
Der umgebende Textkontext verbessert die Erkennungsgenauigkeit, reduziert Fehlalarme und erfasst Randfälle.
Unterstützte Entitätstypen
Umfassende Abdeckung von Arten persönlicher Informationen über Kategorien hinweg
Persönliche Identifikatoren
- Personennamen
- E-Mail-Adressen
- Telefonnummern
- Geburtsdatum
- Alter
- Geschlecht
- Nationalität
Finanzinformationen
- Kreditkartennummern
- IBAN
- BIC/SWIFT
- Bankkontonummern
- Steuer-IDs
- USt-IDs
Staatliche Ausweise
- Sozialversicherungsnummern (SSN)
- Nationale Ausweisnummern
- Reisepassnummern
- Führerscheine
- Krankenversicherungsnummern
Standortdaten
- Straßenadressen
- Städte
- PLZ/Postleitzahlen
- Länder
- GPS-Koordinaten
Digitale Identifikatoren
- IP-Adressen (v4/v6)
- MAC-Adressen
- URLs
- Domainnamen
- Benutzer-IDs
Organisationsdaten
- Firmennamen
- Organisations-IDs
- Registrierungsnummern
- Abteilungsnamen
Temporale Daten
- Daten
- Zeiten
- Datumsbereiche
- Zeitstempel
Internationale Formate
- Deutsche ID (Personalausweis)
- UK National Insurance
- Spanische DNI/NIE
- Italienische Codice Fiscale
- Und 20+ weitere länderspezifische Formate
Unterstützung für benutzerdefinierte Entitäten
Müssen Sie benutzerdefinierte Muster erkennen? Erstellen Sie Ihre eigenen Entitätstypen mit regex-Mustern oder verwenden Sie unseren KI-unterstützten Muster-Generator.
Manuelle Mustererstellung
Definieren Sie regex-Muster für proprietäre Identifikatoren wie interne Mitarbeiter-IDs, Projektcodes oder benutzerdefinierte Referenznummern.
KI-Muster-Generator
Beschreiben Sie, was Sie erkennen möchten, in einfacher Sprache, und unsere KI generiert optimierte regex-Muster für Sie.