Wykrywanie PII: 320+ Typów Jednostek

Nasz silnik wykrywający łączy 317 niestandardowych rozpoznawaczy regex z modelami NLP, aby zidentyfikować ponad 320 typów danych osobowych w ponad 70 krajach. Te same dane wejściowe, te same dane wyjściowe - za każdym razem.

Jak działa wykrywanie

Dopasowanie wzorców Regex (Strukturalne PII)

317 niestandardowych PatternRecognizers z wzorcami regex wykrywa dane strukturalne, takie jak numery identyfikacyjne, numery podatkowe, paszporty i prawa jazdy. Każdy wzorzec używa granicznych asercji, aby zapobiec fałszywym dopasowaniom w kodzie lub danych strukturalnych.

NLP Rozpoznawanie Nazwanych Jednostek (Nazwy i Lokalizacje)

spaCy (25 języków), Stanza NER (7 języków) i transformatory XLM-RoBERTa (16 języków) wykrywają niestrukturalne PII, takie jak imiona i nazwiska, lokalizacje i organizacje, które nie mogą być uchwycone tylko przez regex. Wszystkie modele działają na naszych własnych serwerach w Niemczech — żadne dane nie są wysyłane do Meta, Google, Stanford ani żadnej innej trzeciej strony.

Ocena Pewności

Każde wykrycie zawiera ocenę pewności (0.0–1.0) dla decyzji z udziałem człowieka. Wysoce specyficzne formaty (np. niemiecki IBAN DE89 3704 0044 0532 0130 00) uzyskują ocenę 0.85+, podczas gdy ogólne wzorce cyfr uzyskują ocenę 0.3–0.5 i polegają na słowach kontekstowych do potwierdzenia. Zespoły ds. zgodności mogą przeglądać i nadpisywać wykrycia przed anonimizacją.

Analiza Słów Kontekstowych

Każdy rozpoznawacz ma słowa kontekstowe w odpowiednim języku (np. 'Personalausweis' dla niemieckich ID, 'kitambulisho' dla kenijskich ID). Gdy słowa kontekstowe pojawiają się w pobliżu dopasowania, ocena pewności jest zwiększana.

Obsługiwane Typy Jednostek

Kompleksowe pokrycie typów danych osobowych w różnych kategoriach

Identyfikatory Osobiste

  • Imiona i Nazwiska
  • Adresy E-mail
  • Numery Telefonów
  • Data Urodzenia
  • Wiek
  • Płeć
  • Narodowość

Informacje Finansowe

  • Numery Kart Kredytowych
  • IBAN
  • BIC/SWIFT
  • Numery Kont Bankowych
  • Numery Identyfikacji Podatkowej
  • Numery VAT

Identyfikatory Rządowe

  • Numery Ubezpieczenia Społecznego (SSN)
  • Numery Identyfikacyjne
  • Numery Paszportów
  • Prawo Jazdy
  • Numery Ubezpieczenia Zdrowotnego

Dane Lokalizacyjne

  • Adresy Ulic
  • Miasta
  • Kody Pocztowe
  • Kraje
  • Współrzędne GPS

Identyfikatory Cyfrowe

  • Adresy IP (v4/v6)
  • Adresy MAC
  • URL
  • Nazwy Domen
  • Identyfikatory Użytkowników

Dane Organizacyjne

  • Nazwy Firm
  • Identyfikatory Organizacji
  • Numery Rejestracyjne
  • Nazwy Działów

Dane Czasowe

  • Daty
  • Czasy
  • Zakresy Dat
  • Znaczniki Czasu

Formaty Międzynarodowe

  • Niemiecki ID (Personalausweis)
  • Brytyjski National Insurance
  • Hiszpański DNI/NIE
  • Włoski Codice Fiscale
  • I ponad 70 innych formatów specyficznych dla krajów

Obsługa Niestandardowych Jednostek

Potrzebujesz wykrywać niestandardowe wzorce? Utwórz własne typy jednostek za pomocą wzorców regex lub skorzystaj z naszego generatora wzorców wspomaganego przez AI.

Ręczne Tworzenie Wzorców

Zdefiniuj wzorce regex dla zastrzeżonych identyfikatorów, takich jak wewnętrzne identyfikatory pracowników, kody projektów lub niestandardowe numery referencyjne.

Generator Wzorów AI

Opisz, co chcesz wykryć w prostym języku, a nasza AI wygeneruje zoptymalizowane wzorce regex dla Ciebie.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Zacznij wykrywać PII już dziś

Wypróbuj nasz silnik wykrywający za darmo z 200 tokenami na cykl. Nie wymaga karty kredytowej.