Regex na prvom mieste: Prečo je to dôležité
Náš prístup: Regex + NLP
- 317 rozpoznávačov regex: 100% reprodukovateľné pre štruktúrované údaje
- NLP pre mená a lokality s hodnotením dôveryhodnosti
- Plne auditovateľné — každá detekcia je vysledovateľná k vzoru alebo modelu
- Transparentné: vždy viete, čo bolo rozpoznané a prečo
- Rýchly a predvídateľný výkon
- 48 jazykov v 3 NLP enginoch
Len AI prístupy
- Všetky detekcie sú pravdepodobnostné
- Nie je možné vysvetliť, prečo bolo niečo označené
- Vyžaduje veľké trénovacie datasety
- Ťažké auditovať pre súlad
- Vyššie výpočtové náklady (potrebné GPU)
- Model drift znižuje presnosť v čase
10-krokový proces
Od vstupu po výstup – presne čo sa deje s vaším dokumentom
Vstupný text
Odošlite svoj dokument cez webové rozhranie, API alebo Office doplnok
Detekcia jazyka
Systém identifikuje jazyk dokumentu pre optimálne spracovanie
Tokenizácia
Text je rozdelený na tokeny pre porovnávanie vzorov
Porovnávanie vzorov
317 rozpoznávačov regex a NLP modelov skenuje viac ako 320 typov entít vo viac ako 70 krajinách
Analýza kontextu
Okolitý text zvyšuje presnosť detekcie
Hodnotenie dôveryhodnosti
Každá detekcia dostane skóre dôveryhodnosti (0.0–1.0), čo umožňuje rozhodnutia s ľudským dohľadom
Klasifikácia entít
Detegované položky sú kategorizované podľa typu
Kontrola s ľudským dohľadom
Skontrolujte všetky detekcie, opravte falošné pozitíva a schváľte pred anonymizáciou
Aplikácia anonymizácie
Vyberte si metódu: Nahradiť, Redigovať, Hashovať, Šifrovať alebo Maskovať
Výstupný dokument
Stiahnite si anonymizovaný dokument
MCP Server: AI integrácia s ochranou súkromia
Ako vaše údaje prechádzajú cez MCP Server pre bezpečnosť AI nástrojov
MCP Server funguje ako štít súkromia, zachytáva požiadavky AI nástrojov, anonymizuje PII, spracuje bezpečné údaje cez AI a voliteľne obnoví pôvodné hodnoty.
Požiadavka AI nástroja
Váš AI nástroj (Cursor, Claude) odošle požiadavku obsahujúcu PII
MCP Server zachytí
Server analyzuje a deteguje všetky PII entity
Anonymizácia
PII je nahradené tokenmi alebo redigované
AI spracovanie
AI prijíma a spracováva iba anonymizované údaje
Návrat odpovede
AI odpoveď sa vracia cez MCP Server
De-tokenizácia
Voliteľné: Pôvodné hodnoty obnovené pre používateľa
Často kladené otázky
Používa cloak.business AI na detekciu?
Nie. Detekcia využíva deterministické regex vzory a NLP modely (spaCy, Stanza). To zaručuje 100% reprodukovateľné výsledky — rovnaký vstup vždy vedie k rovnakému výstupu, na rozdiel od pravdepodobnostných AI prístupov.
Prečo regex vzory namiesto AI?
Regex vzory sú auditovateľné, reprodukovateľné a v súlade s predpismi. Môžete presne skontrolovať, čo každý vzor rozpoznáva. Detekcia na báze AI je nedeterministická — výsledky sa môžu líšiť medzi spusteniami, čo sťažuje dokumentáciu pre súlad.
Aká je presnosť detekcie?
S 317 vlastnými rozpoznávačmi vzorov vrátane kontroly kontrolných súčtov (Luhn, IBAN, SSN) dosahuje cloak.business výrazne vyššiu presnosť ako generické NER modely, najmä pre štruktúrované identifikátory ako kreditné karty, daňové ID a čísla občianskych preukazov.
Ktoré jazyky sú podporované?
Podporovaných je 48 jazykov s dedikovanými NLP modelmi na rozpoznávanie pomenovaných entít. Detekcia na báze vzorov (regex) funguje vo všetkých jazykoch, keďže rozpoznáva znakovú štruktúru bez ohľadu na jazyk.
Môžem pridať vlastné vzory entít?
Áno. API podporuje vlastné definície rozpoznávačov, takže môžete pridať vzory pre proprietárne identifikátory, interné referenčné čísla alebo doménovo špecifické dátové formáty.