cloak.business

Как работи cloak.business

Откриване на PII чрез регулярни изрази: 317 детерминирани разпознавачи на шаблони за структурирани данни (лични номера, данъчни номера, кредитни карти), плюс spaCy, Stanza и XLM-RoBERTa NLP за имена и местоположения на 48 езика.

Regex-First: Защо е важно

Нашият подход: Regex + NLP

  • 317 разпознавача с регулярни изрази: 100% възпроизводими за структурирани данни
  • NLP за имена и местоположения с оценки на увереност
  • Напълно одитируемо — всяко откриване е проследимо до шаблон или модел
  • Прозрачност: винаги знаете какво е съвпаднало и защо
  • Бърза, предвидима производителност
  • 48 езика с 3 NLP енджина

Само AI подходи

  • Всички откривания са вероятностни
  • Не може да се обясни защо нещо е маркирано
  • Изисква големи обучаващи набори от данни
  • Трудно за одитиране за съответствие
  • По-високи изчислителни разходи (нужен е GPU)
  • Дрейф на модела влошава точността с времето

10-стъпков процес

От въвеждане до резултат — ето какво точно се случва с Вашия документ

1

Въвеждане на текст

Изпратете документа си чрез уеб интерфейс, API или Office добавка

2

Откриване на език

Системата идентифицира езика на документа за оптимална обработка

3

Токенизация

Текстът се разделя на токени за съвпадение по шаблон

4

Съвпадение по шаблон

317 разпознавача с регулярни изрази и NLP модели сканират за над 320 типа обекти в 70+ държави

5

Анализ на контекст

Околният текст подобрява точността на откриването

6

Оценка на увереност

Всяко откриване получава оценка на увереност (0.0–1.0), позволяваща човешки преглед

7

Класификация на обекти

Откритите елементи се категоризират по тип

8

Човешки преглед

Прегледайте всички откривания, коригирайте фалшиви положителни и одобрете преди анонимизация

9

Прилагане на анонимизация

Изберете метод: Замяна, Заличаване, Хеширане, Криптиране или Маскиране

10

Резултатен документ

Изтеглете анонимизирания си документ

MCP сървър: AI интеграция с приоритет на поверителността

Как Вашите данни преминават през MCP сървъра за сигурност на AI инструментите

MCP сървърът действа като щит за поверителност, прихваща заявки от AI инструменти, анонимизира PII, обработва безопасни данни през AI и по избор възстановява оригиналните стойности.

Заявка от AI инструмент

Вашият AI инструмент (Cursor, Claude) изпраща заявка, съдържаща PII

MCP сървърът прихваща

Сървърът анализира и открива всички PII обекти

Анонимизация

PII се заменя с токени или се заличава

AI обработка

AI получава и обработва само анонимизирани данни

Връщане на отговор

AI отговорът се връща през MCP сървъра

Детокенизация

По избор: Оригиналните стойности се възстановяват за потребителя

Често задавани въпроси

Използва ли cloak.business AI за откриване?

Не. Откриването използва детерминирани регулярни изрази и NLP модели (spaCy, Stanza). Това гарантира 100% възпроизводими резултати — едно и също въвеждане винаги дава един и същ резултат, за разлика от вероятностните AI подходи.

Защо регулярни изрази вместо AI?

Регулярните изрази са одитируеми, възпроизводими и съвместими. Можете да проверите точно какво съвпада всеки шаблон. Откриването с AI е недетерминирано — резултатите могат да се различават при всяко изпълнение, което затруднява документацията за съответствие.

Колко точно е откриването?

С 317 персонализирани разпознавача, включително проверка на контролни суми (Luhn, IBAN, SSN), cloak.business постига значително по-висока точност от стандартните NER модели, особено за структурирани идентификатори като кредитни карти, данъчни и лични номера.

Кои езици се поддържат?

Поддържат се 48 езика с отделни NLP модели за разпознаване на именувани обекти. Откриването чрез регулярни изрази работи на всички езици, тъй като съвпада по знакови шаблони независимо от езика.

Мога ли да добавя собствени шаблони за обекти?

Да. API поддържа персонализирани дефиниции на разпознавачи, така че можете да добавяте шаблони за фирмени идентификатори, вътрешни референтни номера или специфични за домейна формати.

Вижте в действие

Изпробвайте нашето откриване и анонимизация на PII безплатно с 200 токена на цикъл.