Sådan fungerer cloak.business | Regex-baseret PII-detektion

Regex-baseret PII-detektion: 317 deterministiske mønstergenkendere til strukturerede data (ID’er, skattenumre, kreditkort) samt spaCy, Stanza og XLM-RoBERTa NLP til navne og lokationer på tværs af 48 sprog.

Prøv gratis Teknisk dokumentation

Regex-baseret: Hvorfor det er vigtigt

Vores tilgang: Regex + NLP

317 regex-genkendere: 100% reproducerbare for strukturerede data
NLP til navne & lokationer med tillidsscorer
Fuldstændig reviderbar — hver detektion kan spores til et mønster eller en model
Gennemsigtighed: du ved altid, hvad der blev matchet og hvorfor
Hurtig, forudsigelig ydeevne
48 sprog på tværs af 3 NLP-motorer

AI-baserede tilgange

Alle detektioner er probabilistiske
Kan ikke forklare, hvorfor noget blev markeret
Kræver store træningsdatasæt
Svært at revidere for compliance
Højere beregningsomkostninger (GPU krævet)
Modeldrift forringer nøjagtighed over tid

Processen i 10 trin

Fra input til output – sådan behandles dit dokument

Indtast tekst

Indsend dit dokument via webgrænseflade, API eller Office Add-in

Sprogdetektion

Systemet identificerer dokumentets sprog for optimal behandling

Tokenisering

Teksten opdeles i tokens til mønstergenkendelse

Mønstergenkendelse

317 regex-genkendere og NLP-modeller scanner efter 317 entity-typer i 70+ lande

Kontekstanalyse

Omgivende tekst forbedrer detektionsnøjagtigheden

Tillidsscore

Hver detektion får en tillidsscore (0,0–1,0), som muliggør menneskelig gennemgang

Entitetsklassificering

Detekterede elementer kategoriseres efter type

Menneskelig gennemgang

Gennemgå alle detektioner, tilsidesæt falske positiver og godkend før anonymisering

Anvend anonymisering

Vælg metode: Erstat, Rediger, Hash, Krypter eller Maskér

Outputdokument

Download dit anonymiserede dokument

MCP Server: Privacy-først AI-integration

Sådan håndteres dine data i MCP Server for at sikre AI-værktøjer

MCP Server fungerer som et privatlivsskjold, opfanger forespørgsler fra AI-værktøjer, anonymiserer PII, behandler sikre data gennem AI og kan om nødvendigt gendanne de oprindelige værdier.

AI-værktøjsforespørgsel

Dit AI-værktøj (Cursor, Claude) sender en forespørgsel med PII

MCP Server opfanger

Serveren analyserer og detekterer alle PII-entities

Anonymisering

PII erstattes med tokens eller redigeres

AI-behandling

AI modtager og behandler kun anonymiserede data

Svar returneres

AI-svaret returneres via MCP Server

De-tokenisering

Valgfrit: Oprindelige værdier gendannes for brugeren

Læs mere om MCP Server →

Udforsk videre

Teknologi

Dyk ned i regex-baseret detektion og hvorfor det er bedre for compliance

Arkitektur

Systemarkitektur og hvordan komponenterne arbejder sammen

Sikkerhed

Fem sikkerhedslag beskytter dine data i alle trin

Ofte stillede spørgsmål

Bruger cloak.business AI til detektion?

Nej. Detektionen bruger deterministiske regex-mønstre og NLP-modeller (spaCy, Stanza). Dette sikrer 100% reproducerbare resultater — samme input giver altid samme output, i modsætning til probabilistiske AI-tilgange.

Hvorfor regex-mønstre i stedet for AI?

Regex-mønstre er reviderbare, reproducerbare og compliant. Du kan inspicere præcis, hvad hvert mønster matcher. AI-baseret detektion er ikke-deterministisk — resultater kan variere mellem kørsel, hvilket gør compliance-dokumentation vanskelig.

Hvor præcis er detektionen?

Med 317 brugerdefinerede mønstergenkendere inkl. kontrolciffervalidering (Luhn, IBAN, SSN) opnår cloak.business markant højere nøjagtighed end generiske NER-modeller, især for strukturerede identifikatorer som kreditkort, skatte-ID’er og nationale ID-numre.

Hvilke sprog understøttes?

48 sprog understøttes med dedikerede NLP-modeller til navnegenkendelse. Mønsterbaseret detektion (regex) virker på alle sprog, da den matcher tegnmønstre uanset sprog.

Kan jeg tilføje brugerdefinerede entity-mønstre?

Ja. API’et understøtter brugerdefinerede genkenderdefinitioner, så du kan tilføje mønstre for proprietære identifikatorer, interne referencenumre eller domænespecifikke dataformater.

Se det i praksis

Prøv vores PII-detektion og anonymisering gratis med 200 tokens pr. cyklus.