Regex-First: Защо е важно
Нашият подход: Regex + NLP
- 317 разпознавача с регулярни изрази: 100% възпроизводими за структурирани данни
- NLP за имена и местоположения с оценки на увереност
- Напълно одитируемо — всяко откриване е проследимо до шаблон или модел
- Прозрачност: винаги знаете какво е съвпаднало и защо
- Бърза, предвидима производителност
- 48 езика с 3 NLP енджина
Само AI подходи
- Всички откривания са вероятностни
- Не може да се обясни защо нещо е маркирано
- Изисква големи обучаващи набори от данни
- Трудно за одитиране за съответствие
- По-високи изчислителни разходи (нужен е GPU)
- Дрейф на модела влошава точността с времето
10-стъпков процес
От въвеждане до резултат — ето какво точно се случва с Вашия документ
Въвеждане на текст
Изпратете документа си чрез уеб интерфейс, API или Office добавка
Откриване на език
Системата идентифицира езика на документа за оптимална обработка
Токенизация
Текстът се разделя на токени за съвпадение по шаблон
Съвпадение по шаблон
317 разпознавача с регулярни изрази и NLP модели сканират за над 320 типа обекти в 70+ държави
Анализ на контекст
Околният текст подобрява точността на откриването
Оценка на увереност
Всяко откриване получава оценка на увереност (0.0–1.0), позволяваща човешки преглед
Класификация на обекти
Откритите елементи се категоризират по тип
Човешки преглед
Прегледайте всички откривания, коригирайте фалшиви положителни и одобрете преди анонимизация
Прилагане на анонимизация
Изберете метод: Замяна, Заличаване, Хеширане, Криптиране или Маскиране
Резултатен документ
Изтеглете анонимизирания си документ
MCP сървър: AI интеграция с приоритет на поверителността
Как Вашите данни преминават през MCP сървъра за сигурност на AI инструментите
MCP сървърът действа като щит за поверителност, прихваща заявки от AI инструменти, анонимизира PII, обработва безопасни данни през AI и по избор възстановява оригиналните стойности.
Заявка от AI инструмент
Вашият AI инструмент (Cursor, Claude) изпраща заявка, съдържаща PII
MCP сървърът прихваща
Сървърът анализира и открива всички PII обекти
Анонимизация
PII се заменя с токени или се заличава
AI обработка
AI получава и обработва само анонимизирани данни
Връщане на отговор
AI отговорът се връща през MCP сървъра
Детокенизация
По избор: Оригиналните стойности се възстановяват за потребителя
Често задавани въпроси
Използва ли cloak.business AI за откриване?
Не. Откриването използва детерминирани регулярни изрази и NLP модели (spaCy, Stanza). Това гарантира 100% възпроизводими резултати — едно и също въвеждане винаги дава един и същ резултат, за разлика от вероятностните AI подходи.
Защо регулярни изрази вместо AI?
Регулярните изрази са одитируеми, възпроизводими и съвместими. Можете да проверите точно какво съвпада всеки шаблон. Откриването с AI е недетерминирано — резултатите могат да се различават при всяко изпълнение, което затруднява документацията за съответствие.
Колко точно е откриването?
С 317 персонализирани разпознавача, включително проверка на контролни суми (Luhn, IBAN, SSN), cloak.business постига значително по-висока точност от стандартните NER модели, особено за структурирани идентификатори като кредитни карти, данъчни и лични номера.
Кои езици се поддържат?
Поддържат се 48 езика с отделни NLP модели за разпознаване на именувани обекти. Откриването чрез регулярни изрази работи на всички езици, тъй като съвпада по знакови шаблони независимо от езика.
Мога ли да добавя собствени шаблони за обекти?
Да. API поддържа персонализирани дефиниции на разпознавачи, така че можете да добавяте шаблони за фирмени идентификатори, вътрешни референтни номера или специфични за домейна формати.