Regex-Prvo: Zašto je Važno
Naš Pristup: Regex + NLP
- 317 prepoznavatelja regularnih izraza: 100% ponovljivo za strukturirane podatke
- NLP za imena i lokacije s ocjenama pouzdanosti
- Potpuno revizijski — svaka detekcija može se pratiti do uzorka ili modela
- Transparentno: uvijek znate što je prepoznato i zašto
- Brz, predvidljiv rad
- 48 jezika kroz 3 NLP motora
Samo AI Pristupi
- Sve detekcije su probabilističke
- Nije moguće objasniti zašto je nešto označeno
- Zahtijeva velike skupove podataka za treniranje
- Teško za reviziju u svrhu usklađenosti
- Veći troškovi obrade (potreban GPU)
- Pad točnosti modela tijekom vremena
Proces u 10 koraka
Od unosa do izlaza, evo što se točno događa s vašim dokumentom
Unos Teksta
Pošaljite svoj dokument putem web sučelja, API-ja ili Office dodatka
Detekcija Jezika
Sustav prepoznaje jezik dokumenta za optimalnu obradu
Tokenizacija
Tekst se dijeli na tokene radi prepoznavanja uzoraka
Prepoznavanje Uzoraka
317 prepoznavatelja regularnih izraza i NLP modela pretražuje više od 320 tipova entiteta u više od 70 zemalja
Analiza Konteksta
Okružujući tekst poboljšava točnost detekcije
Ocjenjivanje Pouzdanosti
Svaka detekcija dobiva ocjenu pouzdanosti (0.0–1.0) koja omogućuje ljudsku provjeru
Klasifikacija Entiteta
Prepoznate stavke kategoriziraju se prema tipu
Ljudska Provjera
Pregledajte sve detekcije, ispravite lažno pozitivne i odobrite prije anonimizacije
Primjena Anonimizacije
Odaberite metodu: Zamjena, Redakcija, Hashiranje, Enkripcija ili Maskiranje
Izlazni Dokument
Preuzmite svoj anonimizirani dokument
MCP Server: Integracija AI s Privatnošću na Prvom Mjestu
Kako vaši podaci prolaze kroz MCP Server radi sigurnosti AI alata
MCP Server djeluje kao štit privatnosti, presreće zahtjeve AI alata, anonimizira PII, obrađuje sigurne podatke kroz AI i po potrebi vraća izvorne vrijednosti.
Zahtjev AI Alata
Vaš AI alat (Cursor, Claude) šalje zahtjev koji sadrži PII
MCP Server Presreće
Server analizira i detektira sve PII entitete
Anonimizacija
PII se zamjenjuje tokenima ili redigira
AI Obrada
AI prima i obrađuje samo anonimizirane podatke
Povrat Odgovora
AI odgovor se vraća kroz MCP Server
Detokenizacija
Opcionalno: Izvorne vrijednosti vraćaju se korisniku
Često postavljana pitanja
Koristi li cloak.business AI za detekciju?
Ne. Detekcija koristi determinističke regex uzorke i NLP modele (spaCy, Stanza). To osigurava 100% ponovljive rezultate — isti unos uvijek daje isti izlaz, za razliku od probabilističkih AI pristupa.
Zašto regex uzorci umjesto AI-a?
Regex uzorci su revizibilni, ponovljivi i usklađeni. Možete točno provjeriti što svaki uzorak prepoznaje. AI detekcija nije deterministička — rezultati mogu varirati između pokretanja, što otežava dokumentaciju usklađenosti.
Koliko je detekcija točna?
S 317 prilagođenih prepoznavatelja uzoraka uključujući provjeru kontrolnih brojeva (Luhn, IBAN, SSN), cloak.business postiže znatno veću točnost od generičkih NER modela, posebno za strukturirane identifikatore poput kreditnih kartica, poreznih ID-ova i osobnih brojeva.
Koje jezike podržavate?
Podržano je 48 jezika s posebnim NLP modelima za prepoznavanje imenovanih entiteta. Detekcija na temelju uzoraka (regex) radi na svim jezicima jer prepoznaje uzorke znakova neovisno o jeziku.
Mogu li dodati vlastite uzorke entiteta?
Da. API podržava definiranje vlastitih prepoznavatelja tako da možete dodati uzorke za interne identifikatore, interne referentne brojeve ili podatke specifične za vašu domenu.