Откриване на PII: 317 типа обекти

Нашият двигател за откриване комбинира 317 персонализирани regex разпознавачи с NLP модели за идентифициране на над 317 типа лична информация в над 70 държави. Един и същ вход, един и същ изход - всеки път.

Опитайте безплатно Пълна справка за обектите

Как работи откриването

Съответствие на шаблони с Regex (Структурирано PII)

317 персонализирани PatternRecognizers с regex шаблони откриват структурирани данни като национални идентификационни номера, данъчни номера, паспорти и шофьорски книжки. Всеки шаблон използва гранични твърдения, за да предотврати фалшиви съвпадения в код или структурирани данни.

NLP Разпознаване на именувани обекти (Имена и местоположения)

spaCy (25 езика), Stanza NER (7 езика) и XLM-RoBERTa трансформери (16 езика) откриват неструктурирано PII като имена на лица, местоположения и организации, които не могат да бъдат уловени само с regex. Всички модели се изпълняват на нашите собствени сървъри в Германия — никакви данни не се изпращат до Meta, Google, Stanford или трети страни.

Оценка на увереността

Всяко откриване включва оценка на увереността (0.0–1.0) за решения с човешко участие. Много специфични формати (напр. германски IBAN DE89 3704 0044 0532 0130 00) получават оценка 0.85+, докато общи цифрови модели получават оценка 0.3–0.5 и разчитат на контекстни думи за потвърждение. Екипите за съответствие могат да преглеждат и отменят откритията преди анонимизация.

Анализ на контекстни думи

Всеки разпознавач има контекстни думи на съответния език (напр. 'Personalausweis' за германски идентификационни номера, 'kitambulisho' за кенийски идентификационни номера). Когато контекстни думи се появят близо до съвпадение, оценката на увереността се увеличава.

Поддържани типове обекти

Цялостно покритие на типовете лична информация в различни категории

Лични идентификатори

Имена на лица
Имейл адреси
Телефонни номера
Дата на раждане
Възраст
Пол
Националност

Финансова информация

Номера на кредитни карти
IBAN
BIC/SWIFT
Номера на банкови сметки
Данъчни идентификационни номера
ДДС номера

Правителствени идентификатори

Социалноосигурителни номера (SSN)
Национални идентификационни номера
Номера на паспорти
Шофьорски книжки
Идентификационни номера за здравно осигуряване

Данни за местоположение

Адреси на улици
Градове
Пощенски кодове
Държави
GPS координати

Цифрови идентификатори

IP адреси (v4/v6)
MAC адреси
URL адреси
Имена на домейни
Потребителски идентификатори

Данни за организации

Имена на компании
Идентификационни номера на организации
Регистрационни номера
Имена на отдели

Временни данни

Дати
Часове
Диапазони от дати
Времеви печати

Международни формати

Германски идентификационен номер (Personalausweis)
Национална осигуровка на Обединеното кралство
Испански DNI/NIE
Италиански Codice Fiscale
И още над 70 специфични за държавите формати

Поддръжка на персонализирани обекти

Трябва да откривате персонализирани шаблони? Създайте свои собствени типове обекти с regex шаблони или използвайте нашия AI асистент за генериране на шаблони.

Ръчно създаване на шаблони

Определете regex шаблони за собствени идентификатори като вътрешни идентификатори на служители, проектни кодове или персонализирани референтни номера.

AI генератор на шаблони

Опишете какво искате да откриете на обикновен език и нашият AI ще генерира оптимизирани regex шаблони за вас.

Is This Right For You?

Best For

✦Teams needing 317 entity types across personal, financial, government, and organizational data
✦Multilingual PII detection (48 languages) for global compliance and audit requirements
✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
✦Simple English-only use cases where basic regex or keyword matching is sufficient

Започнете да откривате PII днес

Опитайте нашия двигател за откриване безплатно с 200 токена на цикъл. Не се изисква кредитна карта.