Hvernig Greining Virkar
Regex Mynstur Samsvörun (Skipulögð PII)
317 sérsniðnir PatternRecognizers með regex mynstrum greina skipulögð gögn eins og þjóðernisnúmer, skattnúmer, vegabréf og ökuskírteini. Hvert mynstur notar mörk til að koma í veg fyrir rangar samsvaranir í kóða eða skipulögðum gögnum.
NLP Nafngreining (Nöfn & Staðir)
spaCy (25 tungumál), Stanza NER (7 tungumál) og XLM-RoBERTa umbreytingar (16 tungumál) greina óskipulögð PII eins og persónunöfn, staði og stofnanir sem ekki er hægt að fanga með aðeins regex. Öll líkön keyra á eigin netþjónum okkar í Þýskalandi — engin gögn eru send til Meta, Google, Stanford eða þriðja aðila.
Öryggismat
Hver greining inniheldur öryggismat (0.0–1.0) fyrir mannlega ákvarðanatöku. Mjög sértæk snið (t.d. þýska IBAN DE89 3704 0044 0532 0130 00) fá 0.85+, á meðan almenn tölusnið fá 0.3–0.5 og treysta á samhengi orð til staðfestingar. Samræmisteymi geta skoðað og hnekkt greiningum áður en nafnleynd er beitt.
Samhengi Orðgreining
Hver viðurkenningaraðili hefur samhengi orð á viðkomandi tungumáli (t.d. 'Personalausweis' fyrir þýsk ID, 'kitambulisho' fyrir kenísk ID). Þegar samhengi orð koma fram nálægt samsvörun er öryggismat hækkað.
Stuðnings Einingar Tegundir
Alhliða umfjöllun um tegundir persónuupplýsinga í flokkum
Persónuauðkenni
- Persónunöfn
- Netföng
- Símanúmer
- Fæðingardagur
- Aldur
- Kyn
- Þjóðerni
Fjármálaupplýsingar
- Kreditkortanúmer
- IBAN
- BIC/SWIFT
- Bankareikningsnúmer
- Skattkennitölur
- VSK Númer
Ríkisauðkenni
- Kennitölur (SSN)
- Þjóðernisnúmer
- Vegabréfsnúmer
- Ökuskírteini
- Heilbrigðistryggingaauðkenni
Staðsetningargögn
- Heimilisföng
- Borgir
- Póstnúmer
- Lönd
- GPS Hnit
Stafræn auðkenni
- IP Tölur (v4/v6)
- MAC Tölur
- Vefslóðir
- Lén
- Notendaauðkenni
Stofnana Gögn
- Fyrirtækjanöfn
- Stofnanaauðkenni
- Skráningarnúmer
- Deildarnöfn
Tímagögn
- Dagsetningar
- Tímar
- Dagsetningabil
- Tímarammar
Alþjóðleg Snið
- Þýska ID (Personalausweis)
- UK Þjóðtrygging
- Spænska DNI/NIE
- Ítalska Codice Fiscale
- Og 70+ fleiri landsbundin snið
Sérsniðin Einingarstuðningur
Þarftu að greina sérsniðin mynstur? Búðu til eigin einingartegundir með regex mynstrum eða notaðu AI-aðstoðað mynstursmíðara okkar.
Handvirk Mynstursmíð
Skilgreindu regex mynstur fyrir einkaréttar auðkenni eins og innri starfsmannanúmer, verkefnakóða eða sérsniðin tilvísunarnúmer.
AI Mynstursmíðari
Lýstu því sem þú vilt greina á einföldu máli og AI okkar býr til bjartsýni regex mynstur fyrir þig.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient