cloak.business

Виявлення PII: 320+ типів сутностей

Наш двигун виявлення на основі regex ідентифікує понад 50 типів особистої інформації з точністю на основі шаблонів. Один і той же вхід, один і той же вихід - щоразу.

Як працює виявлення

Відповідність шаблонам

Використовує ретельно розроблені шаблони regex для кожного типу сутності, забезпечуючи послідовні та передбачувані результати в усіх документах.

NLP Named Entity Recognition (Names & Locations)

spaCy (25 languages), Stanza NER (7 languages), and XLM-RoBERTa transformers (16 languages) detect unstructured PII like person names, locations, and organizations that cannot be captured by regex alone. All models run on our own servers in Germany — no data is ever sent to Meta, Google, Stanford, or any third party.

Оцінка впевненості

Кожне виявлення включає оцінку впевненості (0-1) на основі сили шаблону та контексту, що допомагає вам фільтрувати результати.

Увага до контексту

Контекст навколишнього тексту покращує точність виявлення, зменшуючи кількість хибнопозитивних результатів, водночас захоплюючи крайові випадки.

Підтримувані типи сутностей

Всеохоплююче покриття типів особистої інформації за категоріями

Особисті ідентифікатори

  • Імена осіб
  • Електронні адреси
  • Номери телефонів
  • Дата народження
  • Вік
  • Стать
  • Національність

Фінансова інформація

  • Номери кредитних карток
  • IBAN
  • BIC/SWIFT
  • Номери банківських рахунків
  • Податкові ідентифікатори
  • Номери ПДВ

Урядові ідентифікатори

  • Номери соціального страхування (SSN)
  • Національні ідентифікаційні номери
  • Номери паспортів
  • Водійські посвідчення
  • Ідентифікатори медичного страхування

Дані про місцезнаходження

  • Вулиці
  • Міста
  • Поштові коди
  • Країни
  • GPS координати

Цифрові ідентифікатори

  • IP адреси (v4/v6)
  • MAC адреси
  • URL-адреси
  • Імена доменів
  • Ідентифікатори користувачів

Дані про організації

  • Назви компаній
  • Ідентифікатори організацій
  • Реєстраційні номери
  • Назви відділів

Часові дані

  • Дати
  • Часи
  • Діапазони дат
  • Часові мітки

Міжнародні формати

  • Німецький ID (Personalausweis)
  • Національне страхування Великобританії
  • Іспанський DNI/NIE
  • Італійський Codice Fiscale
  • І ще 20+ специфічних для країни форматів

Підтримка користувацьких сутностей

Потрібно виявити користувацькі шаблони? Створіть свої власні типи сутностей з шаблонами regex або використовуйте наш генератор шаблонів з підтримкою AI.

Створення шаблона вручну

Визначте шаблони regex для власних ідентифікаторів, таких як внутрішні ідентифікатори співробітників, коди проектів або користувацькі реєстраційні номери.

Генератор шаблонів AI

Опишіть, що ви хочете виявити простими словами, і наш AI створить оптимізовані шаблони regex для вас.

Почніть виявляти PII сьогодні

Спробуйте наш двигун виявлення безкоштовно з 200 токенами за цикл. Кредитна картка не потрібна.