PII Detekzioa: 320+ Entitate Mota

Gure detekzio motorra 317 regex ezagutzaile pertsonalizatu eta NLP ereduak konbinatzen ditu 320+ mota informazio pertsonal identifikatzeko 70+ herrialdetan. Sarrera bera, irteera bera - beti.

Nola Funtzionatzen Du Detekzioak

Regex Ereduen Bat etortzea (PII Egituratua)

317 PatternRecognizers pertsonalizatuk regex ereduak erabiliz datu egituratuak detektatzen dituzte, hala nola, identifikazio nazionalak, zerga zenbakiak, pasaporteak, eta gidabaimenak. Eredu bakoitzak muga baieztapenak erabiltzen ditu kode edo datu egituratuetan bat etortze faltsuak saihesteko.

NLP Entitate Izenen Aitortza (Izenak eta Kokapenak)

spaCy (25 hizkuntza), Stanza NER (7 hizkuntza), eta XLM-RoBERTa transformadoreak (16 hizkuntza) PII egituratu gabekoak detektatzen dituzte, hala nola, pertsona izenak, kokapenak, eta erakundeak, regex bakarrik ezin dituenak harrapatu. Eredu guztiak gure zerbitzarietan exekutatzen dira Alemanian — daturik ez da inoiz bidaltzen Meta, Google, Stanford edo hirugarren batengana.

Konfiantza Puntuazioa

Detekzio bakoitzak konfiantza puntuazio bat dauka (0.0–1.0) giza-erabakiak laguntzeko. Formatu oso espezifikoek (adibidez, Alemaniako IBAN DE89 3704 0044 0532 0130 00) 0.85+ puntuazioa lortzen dute, bitartean, eredu digitalki generikoek 0.3–0.5 puntuazioa lortzen dute eta testuinguru hitzetan oinarritzen dira baieztapenerako. Betetze taldeek detekzioak berrikusi eta gainidatzi ditzakete anonimizazioaren aurretik.

Testuinguru Hitz Analisia

Ezagutzaile bakoitzak testuinguru hitzak ditu dagokion hizkuntzan (adibidez, 'Personalausweis' Alemaniako IDetarako, 'kitambulisho' Kenyako IDetarako). Testuinguru hitzak bat etortze baten ondoan agertzen direnean, konfiantza puntuazioa handitzen da.

Onartutako Entitate Motak

Informazio pertsonal moten estaldura zabala kategoriatan zehar

Identifikatzaile Pertsonalak

  • Pertsona Izenak
  • Email Helbideak
  • Telefono Zenbakiak
  • Jaiotze Data
  • Adina
  • Generoa
  • Nazionalitatea

Informazio Finantzarioa

  • Kreditu Txartel Zenbakiak
  • IBAN
  • BIC/SWIFT
  • Banku Kontu Zenbakiak
  • Zerga IDak
  • BEZ Zenbakiak

Gobernu IDak

  • Gizarte Segurantzako Zenbakiak (SSN)
  • ID Nazional Zenbakiak
  • Pasaporte Zenbakiak
  • Gidabaimenak
  • Osasun Aseguru IDak

Kokapen Datuak

  • Kale Helbideak
  • Hiriak
  • ZIP/Posta Kodeak
  • Herrialdeak
  • GPS Koordenatuak

Identifikatzaile Digitalak

  • IP Helbideak (v4/v6)
  • MAC Helbideak
  • URLak
  • Domeinu Izenak
  • Erabiltzaile IDak

Erakunde Datuak

  • Enpresa Izenak
  • Erakunde IDak
  • Erregistro Zenbakiak
  • Sail Izenak

Datu Tenporalak

  • Datak
  • Orduak
  • Data Tarteak
  • Denbora Zigilua

Nazioarteko Formatuak

  • Alemaniako ID (Personalausweis)
  • Erresuma Batuko Gizarte Segurantza Nazionala
  • Espainiako DNI/NIE
  • Italiako Codice Fiscale
  • Eta 70+ herrialde-formatu espezifiko gehiago

Entitate Pertsonalizatuen Laguntza

Behar duzu eredu pertsonalizatuak detektatzea? Sortu zure entitate motak regex ereduak erabiliz edo erabili gure AI-lagundutako eredu sortzailea.

Eredu Eskuzko Sorkuntza

Definitu regex ereduak identifikatzaile esklusiboetarako, hala nola, barne langile IDak, proiektu kodeak, edo erreferentzia zenbaki pertsonalizatuak.

AI Eredu Sortzailea

Deskribatu zer detektatu nahi duzun hizkera arruntean, eta gure AI-ak zuretzat optimizatutako regex ereduak sortuko ditu.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Hasi PII Detektatzen Gaur

Probatu gure detekzio motorra doan 200 token ziklo bakoitzeko. Ez da kreditu txartelik behar.