Wykrywanie PII: 317 Typów Jednostek

Nasz silnik wykrywający łączy 317 niestandardowych rozpoznawaczy regex z modelami NLP, aby zidentyfikować 317 typów danych osobowych w ponad 70 krajach. Te same dane wejściowe, te same dane wyjściowe - za każdym razem.

Wypróbuj za darmo Pełna referencja jednostek

Jak działa wykrywanie

Dopasowanie wzorców Regex (Strukturalne PII)

317 niestandardowych PatternRecognizers z wzorcami regex wykrywa dane strukturalne, takie jak numery identyfikacyjne, numery podatkowe, paszporty i prawa jazdy. Każdy wzorzec używa granicznych asercji, aby zapobiec fałszywym dopasowaniom w kodzie lub danych strukturalnych.

NLP Rozpoznawanie Nazwanych Jednostek (Nazwy i Lokalizacje)

spaCy (25 języków), Stanza NER (7 języków) i transformatory XLM-RoBERTa (16 języków) wykrywają niestrukturalne PII, takie jak imiona i nazwiska, lokalizacje i organizacje, które nie mogą być uchwycone tylko przez regex. Wszystkie modele działają na naszych własnych serwerach w Niemczech — żadne dane nie są wysyłane do Meta, Google, Stanford ani żadnej innej trzeciej strony.

Ocena Pewności

Każde wykrycie zawiera ocenę pewności (0.0–1.0) dla decyzji z udziałem człowieka. Wysoce specyficzne formaty (np. niemiecki IBAN DE89 3704 0044 0532 0130 00) uzyskują ocenę 0.85+, podczas gdy ogólne wzorce cyfr uzyskują ocenę 0.3–0.5 i polegają na słowach kontekstowych do potwierdzenia. Zespoły ds. zgodności mogą przeglądać i nadpisywać wykrycia przed anonimizacją.

Analiza Słów Kontekstowych

Każdy rozpoznawacz ma słowa kontekstowe w odpowiednim języku (np. 'Personalausweis' dla niemieckich ID, 'kitambulisho' dla kenijskich ID). Gdy słowa kontekstowe pojawiają się w pobliżu dopasowania, ocena pewności jest zwiększana.

Obsługiwane Typy Jednostek

Kompleksowe pokrycie typów danych osobowych w różnych kategoriach

Identyfikatory Osobiste

Imiona i Nazwiska
Adresy E-mail
Numery Telefonów
Data Urodzenia
Wiek
Płeć
Narodowość

Informacje Finansowe

Numery Kart Kredytowych
IBAN
BIC/SWIFT
Numery Kont Bankowych
Numery Identyfikacji Podatkowej
Numery VAT

Identyfikatory Rządowe

Numery Ubezpieczenia Społecznego (SSN)
Numery Identyfikacyjne
Numery Paszportów
Prawo Jazdy
Numery Ubezpieczenia Zdrowotnego

Dane Lokalizacyjne

Adresy Ulic
Miasta
Kody Pocztowe
Kraje
Współrzędne GPS

Identyfikatory Cyfrowe

Adresy IP (v4/v6)
Adresy MAC
URL
Nazwy Domen
Identyfikatory Użytkowników

Dane Organizacyjne

Nazwy Firm
Identyfikatory Organizacji
Numery Rejestracyjne
Nazwy Działów

Dane Czasowe

Daty
Czasy
Zakresy Dat
Znaczniki Czasu

Formaty Międzynarodowe

Niemiecki ID (Personalausweis)
Brytyjski National Insurance
Hiszpański DNI/NIE
Włoski Codice Fiscale
I ponad 70 innych formatów specyficznych dla krajów

Obsługa Niestandardowych Jednostek

Potrzebujesz wykrywać niestandardowe wzorce? Utwórz własne typy jednostek za pomocą wzorców regex lub skorzystaj z naszego generatora wzorców wspomaganego przez AI.

Ręczne Tworzenie Wzorców

Zdefiniuj wzorce regex dla zastrzeżonych identyfikatorów, takich jak wewnętrzne identyfikatory pracowników, kody projektów lub niestandardowe numery referencyjne.

Generator Wzorów AI

Opisz, co chcesz wykryć w prostym języku, a nasza AI wygeneruje zoptymalizowane wzorce regex dla Ciebie.

Is This Right For You?

Best For

✦Teams needing 317 entity types across personal, financial, government, and organizational data
✦Multilingual PII detection (48 languages) for global compliance and audit requirements
✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
✦Simple English-only use cases where basic regex or keyword matching is sufficient

Zacznij wykrywać PII już dziś

Wypróbuj nasz silnik wykrywający za darmo z 200 tokenami na cykl. Nie wymaga karty kredytowej.