Regex-Eerste: Waarom Dit Saak Maak
Ons Benadering: Regex + NLP
- 317 regex-herkenners: 100% herhaalbaar vir gestruktureerde data
- NLP vir name & plekke met sekerheidstellings
- Volledig ouditbaar — elke opsporing is naspeurbaar tot 'n patroon of model
- Deursigtig: u weet altyd wat ooreenstem en waarom
- Vinnig, voorspelbare werkverrigting
- 48 tale oor 3 NLP-enjins
Slegs KI-Benaderings
- Alle opsporings is waarskynlikheidsgebaseer
- Kan nie verduidelik waarom iets gemerk is nie
- Vereis groot opleidingsdatastelle
- Moeilik om vir nakoming te oudit
- Hoër rekenaarkoste (GPU benodig)
- Model-afwyking verswak akkuraatheid oor tyd
Die 10-Stap Proses
Van invoer tot uitvoer, hier is presies wat met u dokument gebeur
Voer Teks In
Dien u dokument in via webkoppelvlak, API of Office-invoegtoepassing
Taalopsporing
Stelsel identifiseer die dokument se taal vir optimale verwerking
Tokenisering
Teks word in tokens opgebreek vir patroonpassing
Patroonpassing
317 regex-herkenners en NLP-modelle skandeer vir 320+ entiteitstipes oor 70+ lande
Konteksanalise
Omringende teks verbeter opsporingsakkuraatheid
Sekerheidstelling
Elke opsporing ontvang 'n sekerheidstelling (0.0–1.0) wat menslike hersiening moontlik maak
Entiteitsklassifikasie
Opgespoorde items word volgens tipe gekategoriseer
Menslike Hersiening
Hersien alle opsporings, pas vals positiewe aan, en keur goed voor anonimisering
Pas Anonimisering Toe
Kies u metode: Vervang, Redigeer, Hash, Enkripteer of Masker
Uitvoer Dokument
Laai u geanonimiseerde dokument af
MCP-bediener: Privaatheid-Eerste KI-integrasie
Hoe u data deur die MCP-bediener vloei om KI-instrumente veilig te hou
Die MCP-bediener dien as 'n privaatheidskerm, onderskep versoeke van KI-instrumente, anonimiseer PII, verwerk veilige data deur KI, en herstel opsioneel oorspronklike waardes.
KI-instrument Versoek
U KI-instrument (Cursor, Claude) stuur 'n versoek wat PII bevat
MCP-bediener Onderskep
Bediener analiseer en spoor alle PII-entiteite op
Anonimisering
PII word vervang met tokens of geredigeer
KI-verwerking
KI ontvang en verwerk slegs geanonimiseerde data
Respons Terugkeer
KI-respons kom terug deur MCP-bediener
De-tokenisering
Opsioneel: Oorspronklike waardes word vir gebruiker herstel
Gereelde Vrae
Gebruik cloak.business KI vir opsporing?
Nee. Opsporing gebruik deterministiese regex-patrone en NLP-modelle (spaCy, Stanza). Dit verseker 100% herhaalbare resultate — dieselfde invoer lewer altyd dieselfde uitset, anders as waarskynlikheidsgebaseerde KI-benaderings.
Waarom regex-patrone in plaas van KI?
Regex-patrone is ouditbaar, herhaalbaar en nakomend. U kan presies inspekteer wat elke patroon pas. KI-gebaseerde opsporing is nie-deterministies — resultate kan tussen lopies verskil, wat nakomingsdokumentasie moeilik maak.
Hoe akkuraat is die opsporing?
Met 317 pasgemaakte patroonherkenners insluitend kontrolesomvalidering (Luhn, IBAN, SSN), behaal cloak.business aansienlik hoër akkuraatheid as generiese NER-modelle, veral vir gestruktureerde identifiseerders soos kredietkaarte, belasting-ID's en nasionale ID-nommers.
Watter tale word ondersteun?
48 tale word ondersteun met toegewyde NLP-modelle vir benoemde entiteitsherkenning. Patroon-gebaseerde opsporing (regex) werk oor alle tale aangesien dit karakterpatrone pas ongeag die taal.
Kan ek pasgemaakte entiteitspatrone byvoeg?
Ja. Die API ondersteun pasgemaakte herkennerdefinisies sodat u patrone kan byvoeg vir eie identifiseerders, interne verwysingsnommers of domeinspesifieke dataformate.