Jak działa wykrywanie
Dopasowanie wzorców Regex (Strukturalne PII)
317 niestandardowych PatternRecognizers z wzorcami regex wykrywa dane strukturalne, takie jak numery identyfikacyjne, numery podatkowe, paszporty i prawa jazdy. Każdy wzorzec używa granicznych asercji, aby zapobiec fałszywym dopasowaniom w kodzie lub danych strukturalnych.
NLP Rozpoznawanie Nazwanych Jednostek (Nazwy i Lokalizacje)
spaCy (25 języków), Stanza NER (7 języków) i transformatory XLM-RoBERTa (16 języków) wykrywają niestrukturalne PII, takie jak imiona i nazwiska, lokalizacje i organizacje, które nie mogą być uchwycone tylko przez regex. Wszystkie modele działają na naszych własnych serwerach w Niemczech — żadne dane nie są wysyłane do Meta, Google, Stanford ani żadnej innej trzeciej strony.
Ocena Pewności
Każde wykrycie zawiera ocenę pewności (0.0–1.0) dla decyzji z udziałem człowieka. Wysoce specyficzne formaty (np. niemiecki IBAN DE89 3704 0044 0532 0130 00) uzyskują ocenę 0.85+, podczas gdy ogólne wzorce cyfr uzyskują ocenę 0.3–0.5 i polegają na słowach kontekstowych do potwierdzenia. Zespoły ds. zgodności mogą przeglądać i nadpisywać wykrycia przed anonimizacją.
Analiza Słów Kontekstowych
Każdy rozpoznawacz ma słowa kontekstowe w odpowiednim języku (np. 'Personalausweis' dla niemieckich ID, 'kitambulisho' dla kenijskich ID). Gdy słowa kontekstowe pojawiają się w pobliżu dopasowania, ocena pewności jest zwiększana.
Obsługiwane Typy Jednostek
Kompleksowe pokrycie typów danych osobowych w różnych kategoriach
Identyfikatory Osobiste
- Imiona i Nazwiska
- Adresy E-mail
- Numery Telefonów
- Data Urodzenia
- Wiek
- Płeć
- Narodowość
Informacje Finansowe
- Numery Kart Kredytowych
- IBAN
- BIC/SWIFT
- Numery Kont Bankowych
- Numery Identyfikacji Podatkowej
- Numery VAT
Identyfikatory Rządowe
- Numery Ubezpieczenia Społecznego (SSN)
- Numery Identyfikacyjne
- Numery Paszportów
- Prawo Jazdy
- Numery Ubezpieczenia Zdrowotnego
Dane Lokalizacyjne
- Adresy Ulic
- Miasta
- Kody Pocztowe
- Kraje
- Współrzędne GPS
Identyfikatory Cyfrowe
- Adresy IP (v4/v6)
- Adresy MAC
- URL
- Nazwy Domen
- Identyfikatory Użytkowników
Dane Organizacyjne
- Nazwy Firm
- Identyfikatory Organizacji
- Numery Rejestracyjne
- Nazwy Działów
Dane Czasowe
- Daty
- Czasy
- Zakresy Dat
- Znaczniki Czasu
Formaty Międzynarodowe
- Niemiecki ID (Personalausweis)
- Brytyjski National Insurance
- Hiszpański DNI/NIE
- Włoski Codice Fiscale
- I ponad 70 innych formatów specyficznych dla krajów
Obsługa Niestandardowych Jednostek
Potrzebujesz wykrywać niestandardowe wzorce? Utwórz własne typy jednostek za pomocą wzorców regex lub skorzystaj z naszego generatora wzorców wspomaganego przez AI.
Ręczne Tworzenie Wzorców
Zdefiniuj wzorce regex dla zastrzeżonych identyfikatorów, takich jak wewnętrzne identyfikatory pracowników, kody projektów lub niestandardowe numery referencyjne.
Generator Wzorów AI
Opisz, co chcesz wykryć w prostym języku, a nasza AI wygeneruje zoptymalizowane wzorce regex dla Ciebie.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient