cloak.business

PII Детекција: 320+ Типови на Ентитети

Нашиот мотор за детекција комбинира 317 прилагодени regex препознавачи со NLP модели за да идентификува 320+ типови на лични информации во 70+ земји. Ист влез, ист излез - секој пат.

Како Работи Детекцијата

Совпаѓање на Regex Шаблони (Структурирано PII)

317 прилагодени PatternRecognizers со regex шаблони детектираат структурирани податоци како национални ID, даночни броеви, пасоши и возачки дозволи. Секој шаблон користи гранични тврдења за да спречи лажни совпаѓања во код или структурирани податоци.

NLP Препознавање на Именувани Ентитети (Имиња и Локации)

spaCy (25 јазици), Stanza NER (7 јазици) и XLM-RoBERTa трансформери (16 јазици) детектираат неструктурирано PII како имиња на лица, локации и организации кои не можат да се фатат само со regex. Сите модели работат на нашите сервери во Германија — податоците никогаш не се испраќаат до Meta, Google, Stanford или било која трета страна.

Оценување на Доверба

Секоја детекција вклучува оценка на доверба (0.0–1.0) за одлуки со човечки вклучување. Многу специфични формати (на пр. германски IBAN DE89 3704 0044 0532 0130 00) добиваат оценка 0.85+, додека генерички дигитални шаблони добиваат оценка 0.3–0.5 и се потпираат на контекстуални зборови за потврда. Тимовите за усогласеност можат да прегледуваат и да ги променат детекциите пред анонимизација.

Анализа на Контекстуални Зборови

Секој препознавач има контекстуални зборови на релевантниот јазик (на пр. 'Personalausweis' за германски ID, 'kitambulisho' за кениски ID). Кога контекстуалните зборови се појавуваат блиску до совпаѓање, оценката на доверба се зголемува.

Поддржани Типови на Ентитети

Сеопфатна покриеност на типови на лични информации низ категории

Лични Идентификатори

  • Имиња на Лица
  • Е-пошта Адреси
  • Телефонски Броеви
  • Датум на Раѓање
  • Возраст
  • Пол
  • Националност

Финансиски Информации

  • Броеви на Кредитни Картички
  • IBAN
  • BIC/SWIFT
  • Броеви на Банкарски Сметки
  • Даночни Броеви
  • Броеви на ДДВ

Владини ID

  • Броеви на Социјално Осигурување (SSN)
  • Национални ID Броеви
  • Броеви на Пасоши
  • Возачки Дозволи
  • ID за Здравствено Осигурување

Локациски Податоци

  • Улични Адреси
  • Градови
  • Поштенски Кодови
  • Држави
  • GPS Координати

Дигитални Идентификатори

  • IP Адреси (v4/v6)
  • MAC Адреси
  • URL-ови
  • Имена на Домени
  • Кориснички ID

Организациски Податоци

  • Имиња на Компании
  • Организациски ID
  • Регистрациони Броеви
  • Имиња на Оддели

Темпорални Податоци

  • Датуми
  • Времиња
  • Временски Опсези
  • Временски Печати

Меѓународни Формати

  • Германски ID (Personalausweis)
  • Британско Национално Осигурување
  • Шпански DNI/NIE
  • Италијански Codice Fiscale
  • И уште 70+ формати специфични за земји

Поддршка за Прилагодени Ентитети

Потребно ви е да детектирате прилагодени шаблони? Создадете свои типови на ентитети со regex шаблони или користете го нашиот AI-асистиран генератор на шаблони.

Рачно Создавање на Шаблони

Дефинирајте regex шаблони за сопствени идентификатори како внатрешни ID на вработени, проектни кодови или прилагодени референтни броеви.

AI Генератор на Шаблони

Описете што сакате да детектирате на обичен јазик, и нашиот AI ќе генерира оптимизирани regex шаблони за вас.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Започнете со Детекција на PII Денес

Пробајте го нашиот мотор за детекција бесплатно со 200 токени по циклус. Не е потребна кредитна картичка.