Как работи откриването
Съответствие на шаблони с Regex (Структурирано PII)
317 персонализирани PatternRecognizers с regex шаблони откриват структурирани данни като национални идентификационни номера, данъчни номера, паспорти и шофьорски книжки. Всеки шаблон използва гранични твърдения, за да предотврати фалшиви съвпадения в код или структурирани данни.
NLP Разпознаване на именувани обекти (Имена и местоположения)
spaCy (25 езика), Stanza NER (7 езика) и XLM-RoBERTa трансформери (16 езика) откриват неструктурирано PII като имена на лица, местоположения и организации, които не могат да бъдат уловени само с regex. Всички модели се изпълняват на нашите собствени сървъри в Германия — никакви данни не се изпращат до Meta, Google, Stanford или трети страни.
Оценка на увереността
Всяко откриване включва оценка на увереността (0.0–1.0) за решения с човешко участие. Много специфични формати (напр. германски IBAN DE89 3704 0044 0532 0130 00) получават оценка 0.85+, докато общи цифрови модели получават оценка 0.3–0.5 и разчитат на контекстни думи за потвърждение. Екипите за съответствие могат да преглеждат и отменят откритията преди анонимизация.
Анализ на контекстни думи
Всеки разпознавач има контекстни думи на съответния език (напр. 'Personalausweis' за германски идентификационни номера, 'kitambulisho' за кенийски идентификационни номера). Когато контекстни думи се появят близо до съвпадение, оценката на увереността се увеличава.
Поддържани типове обекти
Цялостно покритие на типовете лична информация в различни категории
Лични идентификатори
- Имена на лица
- Имейл адреси
- Телефонни номера
- Дата на раждане
- Възраст
- Пол
- Националност
Финансова информация
- Номера на кредитни карти
- IBAN
- BIC/SWIFT
- Номера на банкови сметки
- Данъчни идентификационни номера
- ДДС номера
Правителствени идентификатори
- Социалноосигурителни номера (SSN)
- Национални идентификационни номера
- Номера на паспорти
- Шофьорски книжки
- Идентификационни номера за здравно осигуряване
Данни за местоположение
- Адреси на улици
- Градове
- Пощенски кодове
- Държави
- GPS координати
Цифрови идентификатори
- IP адреси (v4/v6)
- MAC адреси
- URL адреси
- Имена на домейни
- Потребителски идентификатори
Данни за организации
- Имена на компании
- Идентификационни номера на организации
- Регистрационни номера
- Имена на отдели
Временни данни
- Дати
- Часове
- Диапазони от дати
- Времеви печати
Международни формати
- Германски идентификационен номер (Personalausweis)
- Национална осигуровка на Обединеното кралство
- Испански DNI/NIE
- Италиански Codice Fiscale
- И още над 70 специфични за държавите формати
Поддръжка на персонализирани обекти
Трябва да откривате персонализирани шаблони? Създайте свои собствени типове обекти с regex шаблони или използвайте нашия AI асистент за генериране на шаблони.
Ръчно създаване на шаблони
Определете regex шаблони за собствени идентификатори като вътрешни идентификатори на служители, проектни кодове или персонализирани референтни номера.
AI генератор на шаблони
Опишете какво искате да откриете на обикновен език и нашият AI ще генерира оптимизирани regex шаблони за вас.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient