Обнаружение PII: более 50 типов сущностей

Наш движок обнаружения на основе регулярных выражений идентифицирует более 50 типов личной информации с точностью, основанной на шаблонах. Один и тот же ввод, один и тот же вывод - каждый раз.

Как работает обнаружение

Сопоставление шаблонов

Использует тщательно разработанные регулярные выражения для каждого типа сущности, обеспечивая последовательные и предсказуемые результаты во всех документах.

NLP Named Entity Recognition (Names & Locations)

spaCy (25 languages), Stanza NER (7 languages), and XLM-RoBERTa transformers (16 languages) detect unstructured PII like person names, locations, and organizations that cannot be captured by regex alone. All models run on our own servers in Germany — no data is ever sent to Meta, Google, Stanford, or any third party.

Оценка уверенности

Каждое обнаружение включает оценку уверенности (0-1) на основе силы шаблона и контекста, что помогает вам фильтровать результаты.

Осведомленность о контексте

Контекст окружающего текста улучшает точность обнаружения, уменьшая количество ложных срабатываний и захватывая крайние случаи.

Поддерживаемые типы сущностей

Всеобъемлющее покрытие типов личной информации по категориям

Личные идентификаторы

  • Имена людей
  • Электронные адреса
  • Номера телефонов
  • Дата рождения
  • Возраст
  • Пол
  • Национальность

Финансовая информация

  • Номера кредитных карт
  • IBAN
  • BIC/SWIFT
  • Номера банковских счетов
  • Налоговые идентификаторы
  • Номера НДС

Государственные идентификаторы

  • Номера социального страхования (SSN)
  • Национальные номера удостоверений личности
  • Номера паспортов
  • Водительские удостоверения
  • Идентификаторы медицинского страхования

Данные о местоположении

  • Уличные адреса
  • Города
  • Почтовые коды
  • Страны
  • GPS-координаты

Цифровые идентификаторы

  • IP-адреса (v4/v6)
  • MAC-адреса
  • URL-адреса
  • Доменные имена
  • Идентификаторы пользователей

Данные об организации

  • Названия компаний
  • Идентификаторы организаций
  • Регистрационные номера
  • Названия отделов

Временные данные

  • Даты
  • Времена
  • Диапазоны дат
  • Метки времени

Международные форматы

  • Немецкий ID (Personalausweis)
  • Национальное страхование Великобритании
  • Испанский DNI/NIE
  • Итальянский Codice Fiscale
  • И более 20 других форматов, специфичных для стран

Поддержка пользовательских сущностей

Нужно обнаружить пользовательские шаблоны? Создайте свои собственные типы сущностей с помощью регулярных выражений или используйте наш генератор шаблонов с поддержкой ИИ.

Создание шаблона вручную

Определите регулярные выражения для собственных идентификаторов, таких как внутренние идентификаторы сотрудников, коды проектов или пользовательские номера ссылок.

Генератор шаблонов ИИ

Опишите, что вы хотите обнаружить на простом языке, и наш ИИ сгенерирует оптимизированные регулярные выражения для вас.

Начните обнаружение PII сегодня

Попробуйте наш движок обнаружения бесплатно с 200 токенами за цикл. Кредитная карта не требуется.