Ինչպես է աշխատում հայտնաբերումը
Regex Ձևաչափի Համապատասխանություն (Կառուցվածքային PII)
317 հատուկ PatternRecognizers regex ձևաչափերով հայտնաբերում են կառուցվածքային տվյալներ, ինչպես ազգային ID-ներ, հարկային համարներ, անձնագրեր և վարորդական իրավունքներ: Յուրաքանչյուր ձևաչափ օգտագործում է սահմանային հաստատումներ՝ կոդում կամ կառուցվածքային տվյալներում կեղծ համընկնումներից խուսափելու համար:
NLP Անունների և Տեղանքների Ճանաչում (Անուններ և Տեղանքներ)
spaCy (25 լեզուներ), Stanza NER (7 լեզուներ) և XLM-RoBERTa փոխակերպիչները հայտնաբերում են անկառուցված PII, ինչպես անձանց անուններ, տեղանքներ և կազմակերպություններ, որոնք չեն կարող հայտնաբերվել միայն regex-ով: Բոլոր մոդելները աշխատում են մեր սեփական սերվերներում Գերմանիայում — տվյալները երբեք չեն ուղարկվում Meta, Google, Stanford կամ որևէ երրորդ կողմ:
Վստահության Գնահատում
Յուրաքանչյուր հայտնաբերում ներառում է վստահության գնահատական (0.0–1.0) մարդու միջամտությամբ որոշումների համար: Բարձր-հատուկ ձևաչափերը (օրինակ՝ գերմանական IBAN DE89 3704 0044 0532 0130 00) գնահատվում են 0.85+, մինչդեռ ընդհանուր թվային ձևաչափերը գնահատվում են 0.3–0.5 և ապավինում են համատեքստային բառերին հաստատման համար: Համապատասխանության թիմերը կարող են վերանայել և վերափոխել հայտնաբերումները մինչև անանունացումը:
Համատեքստային Բառերի Վերլուծություն
Յուրաքանչյուր ճանաչող ունի համատեքստային բառեր համապատասխան լեզվով (օրինակ՝ 'Personalausweis' գերմանական ID-ների համար, 'kitambulisho' քենիական ID-ների համար): Երբ համատեքստային բառերը հայտնվում են համընկնման մոտ, վստահության գնահատականը բարձրացվում է:
Աջակցվող Սուբյեկտների Տեսակներ
Անձնական տեղեկատվության տեսակների համապարփակ ծածկույթ կատեգորիաներով
Անձնական Նույնացուցիչներ
- Անձանց Անուններ
- Էլ. Փոստի Հասցեներ
- Հեռախոսահամարներ
- Ծննդյան Ամսաթիվ
- Տարիք
- Սեռ
- Ազգություն
Ֆինանսական Տեղեկատվություն
- Վարկային Քարտերի Համարներ
- IBAN
- BIC/SWIFT
- Բանկային Հաշվի Համարներ
- Հարկային ID-ներ
- ԱԱՀ Համարներ
Կառավարական ID-ներ
- Սոցիալական Անվտանգության Համարներ (SSN)
- Ազգային ID-ներ
- Անձնագրերի Համարներ
- Վարորդական Իրավունքներ
- Առողջապահական Ապահովագրության ID-ներ
Տեղանքի Տվյալներ
- Փողոցի Հասցեներ
- Քաղաքներ
- Փոստային Կոդեր
- Երկրներ
- GPS Կոորդինատներ
Թվային Նույնացուցիչներ
- IP Հասցեներ (v4/v6)
- MAC Հասցեներ
- URL-ներ
- Դոմենային Անուններ
- Օգտագործողի ID-ներ
Կազմակերպության Տվյալներ
- Ընկերությունների Անուններ
- Կազմակերպության ID-ներ
- Գրանցման Համարներ
- Բաժնի Անուններ
Ժամանակային Տվյալներ
- Ամսաթվեր
- Ժամեր
- Ամսաթվային Շրջանակներ
- Ժամանակային Նշումներ
Միջազգային Ձևաչափեր
- Գերմանական ID (Personalausweis)
- Մեծ Բրիտանիայի Ազգային Ապահովագրություն
- Իսպանական DNI/NIE
- Իտալական Codice Fiscale
- Եվ 70+ ավելի երկիր-հատուկ ձևաչափեր
Հատուկ Սուբյեկտների Աջակցություն
Պահանջվում է հայտնաբերել հատուկ ձևաչափեր? Ստեղծեք ձեր սեփական սուբյեկտների տեսակները regex ձևաչափերով կամ օգտագործեք մեր AI-օժանդակ ձևաչափի գեներատորը:
Ձեռքով Ձևաչափի Ստեղծում
Սահմանեք regex ձևաչափեր սեփականատիրական նույնացուցիչների համար, ինչպես ներքին աշխատակիցների ID-ներ, նախագծային կոդեր կամ հատուկ հղման համարներ:
AI Ձևաչափի Գեներատոր
Նկարագրեք, թե ինչ եք ցանկանում հայտնաբերել պարզ լեզվով, և մեր AI-ը կստեղծի օպտիմալացված regex ձևաչափեր ձեզ համար:
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient