cloak.business

Hoe cloak.business Werk

Regex-eerste PII-opsporing: 317 deterministiese patroonherkenners vir gestruktureerde data (ID's, belastingnommers, kredietkaarte), plus spaCy, Stanza en XLM-RoBERTa NLP vir name en plekke oor 48 tale.

Regex-Eerste: Waarom Dit Saak Maak

Ons Benadering: Regex + NLP

  • 317 regex-herkenners: 100% herhaalbaar vir gestruktureerde data
  • NLP vir name & plekke met sekerheidstellings
  • Volledig ouditbaar — elke opsporing is naspeurbaar tot 'n patroon of model
  • Deursigtig: u weet altyd wat ooreenstem en waarom
  • Vinnig, voorspelbare werkverrigting
  • 48 tale oor 3 NLP-enjins

Slegs KI-Benaderings

  • Alle opsporings is waarskynlikheidsgebaseer
  • Kan nie verduidelik waarom iets gemerk is nie
  • Vereis groot opleidingsdatastelle
  • Moeilik om vir nakoming te oudit
  • Hoër rekenaarkoste (GPU benodig)
  • Model-afwyking verswak akkuraatheid oor tyd

Die 10-Stap Proses

Van invoer tot uitvoer, hier is presies wat met u dokument gebeur

1

Voer Teks In

Dien u dokument in via webkoppelvlak, API of Office-invoegtoepassing

2

Taalopsporing

Stelsel identifiseer die dokument se taal vir optimale verwerking

3

Tokenisering

Teks word in tokens opgebreek vir patroonpassing

4

Patroonpassing

317 regex-herkenners en NLP-modelle skandeer vir 320+ entiteitstipes oor 70+ lande

5

Konteksanalise

Omringende teks verbeter opsporingsakkuraatheid

6

Sekerheidstelling

Elke opsporing ontvang 'n sekerheidstelling (0.0–1.0) wat menslike hersiening moontlik maak

7

Entiteitsklassifikasie

Opgespoorde items word volgens tipe gekategoriseer

8

Menslike Hersiening

Hersien alle opsporings, pas vals positiewe aan, en keur goed voor anonimisering

9

Pas Anonimisering Toe

Kies u metode: Vervang, Redigeer, Hash, Enkripteer of Masker

10

Uitvoer Dokument

Laai u geanonimiseerde dokument af

MCP-bediener: Privaatheid-Eerste KI-integrasie

Hoe u data deur die MCP-bediener vloei om KI-instrumente veilig te hou

Die MCP-bediener dien as 'n privaatheidskerm, onderskep versoeke van KI-instrumente, anonimiseer PII, verwerk veilige data deur KI, en herstel opsioneel oorspronklike waardes.

KI-instrument Versoek

U KI-instrument (Cursor, Claude) stuur 'n versoek wat PII bevat

MCP-bediener Onderskep

Bediener analiseer en spoor alle PII-entiteite op

Anonimisering

PII word vervang met tokens of geredigeer

KI-verwerking

KI ontvang en verwerk slegs geanonimiseerde data

Respons Terugkeer

KI-respons kom terug deur MCP-bediener

De-tokenisering

Opsioneel: Oorspronklike waardes word vir gebruiker herstel

Gereelde Vrae

Gebruik cloak.business KI vir opsporing?

Nee. Opsporing gebruik deterministiese regex-patrone en NLP-modelle (spaCy, Stanza). Dit verseker 100% herhaalbare resultate — dieselfde invoer lewer altyd dieselfde uitset, anders as waarskynlikheidsgebaseerde KI-benaderings.

Waarom regex-patrone in plaas van KI?

Regex-patrone is ouditbaar, herhaalbaar en nakomend. U kan presies inspekteer wat elke patroon pas. KI-gebaseerde opsporing is nie-deterministies — resultate kan tussen lopies verskil, wat nakomingsdokumentasie moeilik maak.

Hoe akkuraat is die opsporing?

Met 317 pasgemaakte patroonherkenners insluitend kontrolesomvalidering (Luhn, IBAN, SSN), behaal cloak.business aansienlik hoër akkuraatheid as generiese NER-modelle, veral vir gestruktureerde identifiseerders soos kredietkaarte, belasting-ID's en nasionale ID-nommers.

Watter tale word ondersteun?

48 tale word ondersteun met toegewyde NLP-modelle vir benoemde entiteitsherkenning. Patroon-gebaseerde opsporing (regex) werk oor alle tale aangesien dit karakterpatrone pas ongeag die taal.

Kan ek pasgemaakte entiteitspatrone byvoeg?

Ja. Die API ondersteun pasgemaakte herkennerdefinisies sodat u patrone kan byvoeg vir eie identifiseerders, interne verwysingsnommers of domeinspesifieke dataformate.

Sien Dit In Aksie

Probeer ons PII-opsporing en anonimisering gratis met 200 tokens per siklus.