Regex-прво: Зашто је важно
Наш приступ: Regex + NLP
- 317 regex препознавача: 100% репродуктивно за структуиране податке
- NLP за имена и локације са поенима поузданости
- Потпуно ревидибилно — свака детекција се може пратити до шаблона или модела
- Транспарентно: увек знате шта је препознато и зашто
- Брз и предвидљив рад
- 48 језика у 3 NLP енџина
Само AI приступи
- Све детекције су вероватносне
- Не може се објаснити зашто је нешто означено
- Захтева велике скупове података за тренирање
- Тешко за ревизију у складу са прописима
- Виши трошкови рачунара (потребан GPU)
- Дрифтови модела смањују тачност током времена
10 корака процеса
Од улаза до излаза, ево шта се тачно дешава са вашим документом
Унос текста
Пошаљите свој документ преко веб интерфејса, API-ја или Office додатка
Детекција језика
Систем идентификује језик документа ради оптималне обраде
Токенизација
Текст се дели на токене ради препознавања шаблона
Препознавање шаблона
317 regex препознавача и NLP модели скенирају преко 320 типова ентитета у више од 70 земаља
Анализа контекста
Окружујући текст побољшава тачност детекције
Оцењивање поузданости
Свака детекција добија поен поузданости (0.0–1.0) што омогућава људску ревизију
Класификација ентитета
Детектоване ставке се категоришу по типу
Ревизија од стране људи
Прегледајте све детекције, исправите лажне позитиве и одобрите пре анонимизације
Примена анонимизације
Изаберите метод: Замена, Редакција, Хеширање, Енкрипција или Маскирање
Излазни документ
Преузмите свој анонимизовани документ
MCP сервер: AI интеграција са приватношћу на првом месту
Како ваши подаци пролазе кроз MCP сервер ради безбедности AI алата
MCP сервер делује као штит приватности, пресреће захтеве AI алата, анонимизује PII, обрађује безбедне податке кроз AI и по потреби враћа оригиналне вредности.
Захтев AI алата
Ваш AI алат (Cursor, Claude) шаље захтев који садржи PII
MCP сервер пресреће
Сервер анализира и детектује све PII ентитете
Анонимизација
PII се замењује токенима или редигује
AI обрада
AI прима и обрађује само анонимизоване податке
Враћање одговора
AI одговор се враћа преко MCP сервера
Детокенизација
Опционо: Оригиналне вредности се враћају кориснику
Често постављана питања
Да ли cloak.business користи AI за детекцију?
Не. Детекција користи детерминистичке regex шаблоне и NLP моделе (spaCy, Stanza). Ово обезбеђује 100% репродуктивне резултате — исти унос увек даје исти излаз, за разлику од вероватносних AI приступа.
Зашто regex шаблони уместо AI?
Regex шаблони су ревидибилни, репродуктивни и усклађени са прописима. Можете прегледати шта сваки шаблон поклапа. AI-базирана детекција је недетерминистичка — резултати могу варирати, што отежава документацију усклађености.
Колико је тачна детекција?
Са 317 прилагођених препознавача шаблона укључујући валидацију контролних бројева (Luhn, IBAN, SSN), cloak.business постиже знатно већу тачност од генеричких NER модела, посебно за структуиране идентификаторе као што су кредитне картице, порески ИД-еви и национални идентификациони бројеви.
Који језици су подржани?
Подржано је 48 језика са посебним NLP моделима за препознавање именованих ентитета. Детекција на бази шаблона (regex) ради на свим језицима јер поклапа карактеристичне обрасце без обзира на језик.
Могу ли да додам сопствене шаблоне ентитета?
Да. API подржава дефинисање прилагођених препознавача тако да можете додати шаблоне за интерне идентификаторе, унутрашње референтне бројеве или доменски специфичне формате података.