Kako funkcionira Regex-First PII detekcija

Detekcija PII na temelju regularnih izraza: 317 determinističkih prepoznavatelja uzoraka za strukturirane podatke (osobne iskaznice, porezne brojeve, kreditne kartice), uz spaCy, Stanza i XLM-RoBERTa NLP za imena i lokacije na 48 jezika.

Isprobajte Besplatno Tehnička Dokumentacija

Regex-Prvo: Zašto je Važno

Naš Pristup: Regex + NLP

317 prepoznavatelja regularnih izraza: 100% ponovljivo za strukturirane podatke
NLP za imena i lokacije s ocjenama pouzdanosti
Potpuno revizijski — svaka detekcija može se pratiti do uzorka ili modela
Transparentno: uvijek znate što je prepoznato i zašto
Brz, predvidljiv rad
48 jezika kroz 3 NLP motora

Samo AI Pristupi

Sve detekcije su probabilističke
Nije moguće objasniti zašto je nešto označeno
Zahtijeva velike skupove podataka za treniranje
Teško za reviziju u svrhu usklađenosti
Veći troškovi obrade (potreban GPU)
Pad točnosti modela tijekom vremena

Proces u 10 koraka

Od unosa do izlaza, evo što se točno događa s vašim dokumentom

Unos Teksta

Pošaljite svoj dokument putem web sučelja, API-ja ili Office dodatka

Detekcija Jezika

Sustav prepoznaje jezik dokumenta za optimalnu obradu

Tokenizacija

Tekst se dijeli na tokene radi prepoznavanja uzoraka

Prepoznavanje Uzoraka

317 prepoznavatelja regularnih izraza i NLP modela pretražuje 317 tipova entiteta u više od 70 zemalja

Analiza Konteksta

Okružujući tekst poboljšava točnost detekcije

Ocjenjivanje Pouzdanosti

Svaka detekcija dobiva ocjenu pouzdanosti (0.0–1.0) koja omogućuje ljudsku provjeru

Klasifikacija Entiteta

Prepoznate stavke kategoriziraju se prema tipu

Ljudska Provjera

Pregledajte sve detekcije, ispravite lažno pozitivne i odobrite prije anonimizacije

Primjena Anonimizacije

Odaberite metodu: Zamjena, Redakcija, Hashiranje, Enkripcija ili Maskiranje

Izlazni Dokument

Preuzmite svoj anonimizirani dokument

MCP Server: Integracija AI s Privatnošću na Prvom Mjestu

Kako vaši podaci prolaze kroz MCP Server radi sigurnosti AI alata

MCP Server djeluje kao štit privatnosti, presreće zahtjeve AI alata, anonimizira PII, obrađuje sigurne podatke kroz AI i po potrebi vraća izvorne vrijednosti.

Zahtjev AI Alata

Vaš AI alat (Cursor, Claude) šalje zahtjev koji sadrži PII

MCP Server Presreće

Server analizira i detektira sve PII entitete

Anonimizacija

PII se zamjenjuje tokenima ili redigira

AI Obrada

AI prima i obrađuje samo anonimizirane podatke

Povrat Odgovora

AI odgovor se vraća kroz MCP Server

Detokenizacija

Opcionalno: Izvorne vrijednosti vraćaju se korisniku

Saznajte više o MCP Serveru →

Istražite Dalje

Tehnologija

Detaljan uvid u detekciju na temelju regularnih izraza i zašto je bolja za usklađenost

Arhitektura

Arhitektura sustava i način rada komponenti

Sigurnost

Pet sigurnosnih slojeva koji štite vaše podatke u svakom koraku

Često postavljana pitanja

Koristi li cloak.business AI za detekciju?

Ne. Detekcija koristi determinističke regex uzorke i NLP modele (spaCy, Stanza). To osigurava 100% ponovljive rezultate — isti unos uvijek daje isti izlaz, za razliku od probabilističkih AI pristupa.

Zašto regex uzorci umjesto AI-a?

Regex uzorci su revizibilni, ponovljivi i usklađeni. Možete točno provjeriti što svaki uzorak prepoznaje. AI detekcija nije deterministička — rezultati mogu varirati između pokretanja, što otežava dokumentaciju usklađenosti.

Koliko je detekcija točna?

S 317 prilagođenih prepoznavatelja uzoraka uključujući provjeru kontrolnih brojeva (Luhn, IBAN, SSN), cloak.business postiže znatno veću točnost od generičkih NER modela, posebno za strukturirane identifikatore poput kreditnih kartica, poreznih ID-ova i osobnih brojeva.

Koje jezike podržavate?

Podržano je 48 jezika s posebnim NLP modelima za prepoznavanje imenovanih entiteta. Detekcija na temelju uzoraka (regex) radi na svim jezicima jer prepoznaje uzorke znakova neovisno o jeziku.

Mogu li dodati vlastite uzorke entiteta?

Da. API podržava definiranje vlastitih prepoznavatelja tako da možete dodati uzorke za interne identifikatore, interne referentne brojeve ili podatke specifične za vašu domenu.

Pogledajte u Praksi

Isprobajte našu detekciju i anonimizaciju PII besplatno s 200 tokena po ciklusu.