cloak.business

Како cloak.business функционише

Regex-прва PII детекција: 317 детерминистичких шаблона за структуиране податке (ИД-еви, порески бројеви, кредитне картице), као и spaCy, Stanza и XLM-RoBERTa NLP за имена и локације на 48 језика.

Regex-прво: Зашто је важно

Наш приступ: Regex + NLP

  • 317 regex препознавача: 100% репродуктивно за структуиране податке
  • NLP за имена и локације са поенима поузданости
  • Потпуно ревидибилно — свака детекција се може пратити до шаблона или модела
  • Транспарентно: увек знате шта је препознато и зашто
  • Брз и предвидљив рад
  • 48 језика у 3 NLP енџина

Само AI приступи

  • Све детекције су вероватносне
  • Не може се објаснити зашто је нешто означено
  • Захтева велике скупове података за тренирање
  • Тешко за ревизију у складу са прописима
  • Виши трошкови рачунара (потребан GPU)
  • Дрифтови модела смањују тачност током времена

10 корака процеса

Од улаза до излаза, ево шта се тачно дешава са вашим документом

1

Унос текста

Пошаљите свој документ преко веб интерфејса, API-ја или Office додатка

2

Детекција језика

Систем идентификује језик документа ради оптималне обраде

3

Токенизација

Текст се дели на токене ради препознавања шаблона

4

Препознавање шаблона

317 regex препознавача и NLP модели скенирају преко 320 типова ентитета у више од 70 земаља

5

Анализа контекста

Окружујући текст побољшава тачност детекције

6

Оцењивање поузданости

Свака детекција добија поен поузданости (0.0–1.0) што омогућава људску ревизију

7

Класификација ентитета

Детектоване ставке се категоришу по типу

8

Ревизија од стране људи

Прегледајте све детекције, исправите лажне позитиве и одобрите пре анонимизације

9

Примена анонимизације

Изаберите метод: Замена, Редакција, Хеширање, Енкрипција или Маскирање

10

Излазни документ

Преузмите свој анонимизовани документ

MCP сервер: AI интеграција са приватношћу на првом месту

Како ваши подаци пролазе кроз MCP сервер ради безбедности AI алата

MCP сервер делује као штит приватности, пресреће захтеве AI алата, анонимизује PII, обрађује безбедне податке кроз AI и по потреби враћа оригиналне вредности.

Захтев AI алата

Ваш AI алат (Cursor, Claude) шаље захтев који садржи PII

MCP сервер пресреће

Сервер анализира и детектује све PII ентитете

Анонимизација

PII се замењује токенима или редигује

AI обрада

AI прима и обрађује само анонимизоване податке

Враћање одговора

AI одговор се враћа преко MCP сервера

Детокенизација

Опционо: Оригиналне вредности се враћају кориснику

Често постављана питања

Да ли cloak.business користи AI за детекцију?

Не. Детекција користи детерминистичке regex шаблоне и NLP моделе (spaCy, Stanza). Ово обезбеђује 100% репродуктивне резултате — исти унос увек даје исти излаз, за разлику од вероватносних AI приступа.

Зашто regex шаблони уместо AI?

Regex шаблони су ревидибилни, репродуктивни и усклађени са прописима. Можете прегледати шта сваки шаблон поклапа. AI-базирана детекција је недетерминистичка — резултати могу варирати, што отежава документацију усклађености.

Колико је тачна детекција?

Са 317 прилагођених препознавача шаблона укључујући валидацију контролних бројева (Luhn, IBAN, SSN), cloak.business постиже знатно већу тачност од генеричких NER модела, посебно за структуиране идентификаторе као што су кредитне картице, порески ИД-еви и национални идентификациони бројеви.

Који језици су подржани?

Подржано је 48 језика са посебним NLP моделима за препознавање именованих ентитета. Детекција на бази шаблона (regex) ради на свим језицима јер поклапа карактеристичне обрасце без обзира на језик.

Могу ли да додам сопствене шаблоне ентитета?

Да. API подржава дефинисање прилагођених препознавача тако да можете додати шаблоне за интерне идентификаторе, унутрашње референтне бројеве или доменски специфичне формате података.

Погледајте у пракси

Пробајте нашу PII детекцију и анонимизацију бесплатно са 200 токена по циклусу.