Kako cloak.business Funkcionira

Detekcija PII na temelju regularnih izraza: 317 determinističkih prepoznavatelja uzoraka za strukturirane podatke (osobne iskaznice, porezne brojeve, kreditne kartice), uz spaCy, Stanza i XLM-RoBERTa NLP za imena i lokacije na 48 jezika.

Regex-Prvo: Zašto je Važno

Naš Pristup: Regex + NLP

  • 317 prepoznavatelja regularnih izraza: 100% ponovljivo za strukturirane podatke
  • NLP za imena i lokacije s ocjenama pouzdanosti
  • Potpuno revizijski — svaka detekcija može se pratiti do uzorka ili modela
  • Transparentno: uvijek znate što je prepoznato i zašto
  • Brz, predvidljiv rad
  • 48 jezika kroz 3 NLP motora

Samo AI Pristupi

  • Sve detekcije su probabilističke
  • Nije moguće objasniti zašto je nešto označeno
  • Zahtijeva velike skupove podataka za treniranje
  • Teško za reviziju u svrhu usklađenosti
  • Veći troškovi obrade (potreban GPU)
  • Pad točnosti modela tijekom vremena

Proces u 10 koraka

Od unosa do izlaza, evo što se točno događa s vašim dokumentom

1

Unos Teksta

Pošaljite svoj dokument putem web sučelja, API-ja ili Office dodatka

2

Detekcija Jezika

Sustav prepoznaje jezik dokumenta za optimalnu obradu

3

Tokenizacija

Tekst se dijeli na tokene radi prepoznavanja uzoraka

4

Prepoznavanje Uzoraka

317 prepoznavatelja regularnih izraza i NLP modela pretražuje više od 320 tipova entiteta u više od 70 zemalja

5

Analiza Konteksta

Okružujući tekst poboljšava točnost detekcije

6

Ocjenjivanje Pouzdanosti

Svaka detekcija dobiva ocjenu pouzdanosti (0.0–1.0) koja omogućuje ljudsku provjeru

7

Klasifikacija Entiteta

Prepoznate stavke kategoriziraju se prema tipu

8

Ljudska Provjera

Pregledajte sve detekcije, ispravite lažno pozitivne i odobrite prije anonimizacije

9

Primjena Anonimizacije

Odaberite metodu: Zamjena, Redakcija, Hashiranje, Enkripcija ili Maskiranje

10

Izlazni Dokument

Preuzmite svoj anonimizirani dokument

MCP Server: Integracija AI s Privatnošću na Prvom Mjestu

Kako vaši podaci prolaze kroz MCP Server radi sigurnosti AI alata

MCP Server djeluje kao štit privatnosti, presreće zahtjeve AI alata, anonimizira PII, obrađuje sigurne podatke kroz AI i po potrebi vraća izvorne vrijednosti.

Zahtjev AI Alata

Vaš AI alat (Cursor, Claude) šalje zahtjev koji sadrži PII

MCP Server Presreće

Server analizira i detektira sve PII entitete

Anonimizacija

PII se zamjenjuje tokenima ili redigira

AI Obrada

AI prima i obrađuje samo anonimizirane podatke

Povrat Odgovora

AI odgovor se vraća kroz MCP Server

Detokenizacija

Opcionalno: Izvorne vrijednosti vraćaju se korisniku

Često postavljana pitanja

Koristi li cloak.business AI za detekciju?

Ne. Detekcija koristi determinističke regex uzorke i NLP modele (spaCy, Stanza). To osigurava 100% ponovljive rezultate — isti unos uvijek daje isti izlaz, za razliku od probabilističkih AI pristupa.

Zašto regex uzorci umjesto AI-a?

Regex uzorci su revizibilni, ponovljivi i usklađeni. Možete točno provjeriti što svaki uzorak prepoznaje. AI detekcija nije deterministička — rezultati mogu varirati između pokretanja, što otežava dokumentaciju usklađenosti.

Koliko je detekcija točna?

S 317 prilagođenih prepoznavatelja uzoraka uključujući provjeru kontrolnih brojeva (Luhn, IBAN, SSN), cloak.business postiže znatno veću točnost od generičkih NER modela, posebno za strukturirane identifikatore poput kreditnih kartica, poreznih ID-ova i osobnih brojeva.

Koje jezike podržavate?

Podržano je 48 jezika s posebnim NLP modelima za prepoznavanje imenovanih entiteta. Detekcija na temelju uzoraka (regex) radi na svim jezicima jer prepoznaje uzorke znakova neovisno o jeziku.

Mogu li dodati vlastite uzorke entiteta?

Da. API podržava definiranje vlastitih prepoznavatelja tako da možete dodati uzorke za interne identifikatore, interne referentne brojeve ili podatke specifične za vašu domenu.

Pogledajte u Praksi

Isprobajte našu detekciju i anonimizaciju PII besplatno s 200 tokena po ciklusu.