Nola Funtzionatzen Du Detekzioak
Regex Ereduen Bat etortzea (PII Egituratua)
317 PatternRecognizers pertsonalizatuk regex ereduak erabiliz datu egituratuak detektatzen dituzte, hala nola, identifikazio nazionalak, zerga zenbakiak, pasaporteak, eta gidabaimenak. Eredu bakoitzak muga baieztapenak erabiltzen ditu kode edo datu egituratuetan bat etortze faltsuak saihesteko.
NLP Entitate Izenen Aitortza (Izenak eta Kokapenak)
spaCy (25 hizkuntza), Stanza NER (7 hizkuntza), eta XLM-RoBERTa transformadoreak (16 hizkuntza) PII egituratu gabekoak detektatzen dituzte, hala nola, pertsona izenak, kokapenak, eta erakundeak, regex bakarrik ezin dituenak harrapatu. Eredu guztiak gure zerbitzarietan exekutatzen dira Alemanian — daturik ez da inoiz bidaltzen Meta, Google, Stanford edo hirugarren batengana.
Konfiantza Puntuazioa
Detekzio bakoitzak konfiantza puntuazio bat dauka (0.0–1.0) giza-erabakiak laguntzeko. Formatu oso espezifikoek (adibidez, Alemaniako IBAN DE89 3704 0044 0532 0130 00) 0.85+ puntuazioa lortzen dute, bitartean, eredu digitalki generikoek 0.3–0.5 puntuazioa lortzen dute eta testuinguru hitzetan oinarritzen dira baieztapenerako. Betetze taldeek detekzioak berrikusi eta gainidatzi ditzakete anonimizazioaren aurretik.
Testuinguru Hitz Analisia
Ezagutzaile bakoitzak testuinguru hitzak ditu dagokion hizkuntzan (adibidez, 'Personalausweis' Alemaniako IDetarako, 'kitambulisho' Kenyako IDetarako). Testuinguru hitzak bat etortze baten ondoan agertzen direnean, konfiantza puntuazioa handitzen da.
Onartutako Entitate Motak
Informazio pertsonal moten estaldura zabala kategoriatan zehar
Identifikatzaile Pertsonalak
- Pertsona Izenak
- Email Helbideak
- Telefono Zenbakiak
- Jaiotze Data
- Adina
- Generoa
- Nazionalitatea
Informazio Finantzarioa
- Kreditu Txartel Zenbakiak
- IBAN
- BIC/SWIFT
- Banku Kontu Zenbakiak
- Zerga IDak
- BEZ Zenbakiak
Gobernu IDak
- Gizarte Segurantzako Zenbakiak (SSN)
- ID Nazional Zenbakiak
- Pasaporte Zenbakiak
- Gidabaimenak
- Osasun Aseguru IDak
Kokapen Datuak
- Kale Helbideak
- Hiriak
- ZIP/Posta Kodeak
- Herrialdeak
- GPS Koordenatuak
Identifikatzaile Digitalak
- IP Helbideak (v4/v6)
- MAC Helbideak
- URLak
- Domeinu Izenak
- Erabiltzaile IDak
Erakunde Datuak
- Enpresa Izenak
- Erakunde IDak
- Erregistro Zenbakiak
- Sail Izenak
Datu Tenporalak
- Datak
- Orduak
- Data Tarteak
- Denbora Zigilua
Nazioarteko Formatuak
- Alemaniako ID (Personalausweis)
- Erresuma Batuko Gizarte Segurantza Nazionala
- Espainiako DNI/NIE
- Italiako Codice Fiscale
- Eta 70+ herrialde-formatu espezifiko gehiago
Entitate Pertsonalizatuen Laguntza
Behar duzu eredu pertsonalizatuak detektatzea? Sortu zure entitate motak regex ereduak erabiliz edo erabili gure AI-lagundutako eredu sortzailea.
Eredu Eskuzko Sorkuntza
Definitu regex ereduak identifikatzaile esklusiboetarako, hala nola, barne langile IDak, proiektu kodeak, edo erreferentzia zenbaki pertsonalizatuak.
AI Eredu Sortzailea
Deskribatu zer detektatu nahi duzun hizkera arruntean, eta gure AI-ak zuretzat optimizatutako regex ereduak sortuko ditu.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient