Ako funguje cloak.business

Detekcia PII na báze regex: 317 deterministických rozpoznávačov vzorov pre štruktúrované údaje (ID, daňové čísla, kreditné karty), plus spaCy, Stanza a XLM-RoBERTa NLP pre mená a lokality v 48 jazykoch.

Regex na prvom mieste: Prečo je to dôležité

Náš prístup: Regex + NLP

  • 317 rozpoznávačov regex: 100% reprodukovateľné pre štruktúrované údaje
  • NLP pre mená a lokality s hodnotením dôveryhodnosti
  • Plne auditovateľné — každá detekcia je vysledovateľná k vzoru alebo modelu
  • Transparentné: vždy viete, čo bolo rozpoznané a prečo
  • Rýchly a predvídateľný výkon
  • 48 jazykov v 3 NLP enginoch

Len AI prístupy

  • Všetky detekcie sú pravdepodobnostné
  • Nie je možné vysvetliť, prečo bolo niečo označené
  • Vyžaduje veľké trénovacie datasety
  • Ťažké auditovať pre súlad
  • Vyššie výpočtové náklady (potrebné GPU)
  • Model drift znižuje presnosť v čase

10-krokový proces

Od vstupu po výstup – presne čo sa deje s vaším dokumentom

1

Vstupný text

Odošlite svoj dokument cez webové rozhranie, API alebo Office doplnok

2

Detekcia jazyka

Systém identifikuje jazyk dokumentu pre optimálne spracovanie

3

Tokenizácia

Text je rozdelený na tokeny pre porovnávanie vzorov

4

Porovnávanie vzorov

317 rozpoznávačov regex a NLP modelov skenuje viac ako 320 typov entít vo viac ako 70 krajinách

5

Analýza kontextu

Okolitý text zvyšuje presnosť detekcie

6

Hodnotenie dôveryhodnosti

Každá detekcia dostane skóre dôveryhodnosti (0.0–1.0), čo umožňuje rozhodnutia s ľudským dohľadom

7

Klasifikácia entít

Detegované položky sú kategorizované podľa typu

8

Kontrola s ľudským dohľadom

Skontrolujte všetky detekcie, opravte falošné pozitíva a schváľte pred anonymizáciou

9

Aplikácia anonymizácie

Vyberte si metódu: Nahradiť, Redigovať, Hashovať, Šifrovať alebo Maskovať

10

Výstupný dokument

Stiahnite si anonymizovaný dokument

MCP Server: AI integrácia s ochranou súkromia

Ako vaše údaje prechádzajú cez MCP Server pre bezpečnosť AI nástrojov

MCP Server funguje ako štít súkromia, zachytáva požiadavky AI nástrojov, anonymizuje PII, spracuje bezpečné údaje cez AI a voliteľne obnoví pôvodné hodnoty.

Požiadavka AI nástroja

Váš AI nástroj (Cursor, Claude) odošle požiadavku obsahujúcu PII

MCP Server zachytí

Server analyzuje a deteguje všetky PII entity

Anonymizácia

PII je nahradené tokenmi alebo redigované

AI spracovanie

AI prijíma a spracováva iba anonymizované údaje

Návrat odpovede

AI odpoveď sa vracia cez MCP Server

De-tokenizácia

Voliteľné: Pôvodné hodnoty obnovené pre používateľa

Často kladené otázky

Používa cloak.business AI na detekciu?

Nie. Detekcia využíva deterministické regex vzory a NLP modely (spaCy, Stanza). To zaručuje 100% reprodukovateľné výsledky — rovnaký vstup vždy vedie k rovnakému výstupu, na rozdiel od pravdepodobnostných AI prístupov.

Prečo regex vzory namiesto AI?

Regex vzory sú auditovateľné, reprodukovateľné a v súlade s predpismi. Môžete presne skontrolovať, čo každý vzor rozpoznáva. Detekcia na báze AI je nedeterministická — výsledky sa môžu líšiť medzi spusteniami, čo sťažuje dokumentáciu pre súlad.

Aká je presnosť detekcie?

S 317 vlastnými rozpoznávačmi vzorov vrátane kontroly kontrolných súčtov (Luhn, IBAN, SSN) dosahuje cloak.business výrazne vyššiu presnosť ako generické NER modely, najmä pre štruktúrované identifikátory ako kreditné karty, daňové ID a čísla občianskych preukazov.

Ktoré jazyky sú podporované?

Podporovaných je 48 jazykov s dedikovanými NLP modelmi na rozpoznávanie pomenovaných entít. Detekcia na báze vzorov (regex) funguje vo všetkých jazykoch, keďže rozpoznáva znakovú štruktúru bez ohľadu na jazyk.

Môžem pridať vlastné vzory entít?

Áno. API podporuje vlastné definície rozpoznávačov, takže môžete pridať vzory pre proprietárne identifikátory, interné referenčné čísla alebo doménovo špecifické dátové formáty.

Pozrite si v praxi

Vyskúšajte detekciu a anonymizáciu PII zadarmo s 200 tokenmi na cyklus.