cloak.business

Sådan fungerer cloak.business

Regex-baseret PII-detektion: 317 deterministiske mønstergenkendere til strukturerede data (ID’er, skattenumre, kreditkort) samt spaCy, Stanza og XLM-RoBERTa NLP til navne og lokationer på tværs af 48 sprog.

Regex-baseret: Hvorfor det er vigtigt

Vores tilgang: Regex + NLP

  • 317 regex-genkendere: 100% reproducerbare for strukturerede data
  • NLP til navne & lokationer med tillidsscorer
  • Fuldstændig reviderbar — hver detektion kan spores til et mønster eller en model
  • Gennemsigtighed: du ved altid, hvad der blev matchet og hvorfor
  • Hurtig, forudsigelig ydeevne
  • 48 sprog på tværs af 3 NLP-motorer

AI-baserede tilgange

  • Alle detektioner er probabilistiske
  • Kan ikke forklare, hvorfor noget blev markeret
  • Kræver store træningsdatasæt
  • Svært at revidere for compliance
  • Højere beregningsomkostninger (GPU krævet)
  • Modeldrift forringer nøjagtighed over tid

Processen i 10 trin

Fra input til output – sådan behandles dit dokument

1

Indtast tekst

Indsend dit dokument via webgrænseflade, API eller Office Add-in

2

Sprogdetektion

Systemet identificerer dokumentets sprog for optimal behandling

3

Tokenisering

Teksten opdeles i tokens til mønstergenkendelse

4

Mønstergenkendelse

317 regex-genkendere og NLP-modeller scanner efter 320+ entity-typer i 70+ lande

5

Kontekstanalyse

Omgivende tekst forbedrer detektionsnøjagtigheden

6

Tillidsscore

Hver detektion får en tillidsscore (0,0–1,0), som muliggør menneskelig gennemgang

7

Entitetsklassificering

Detekterede elementer kategoriseres efter type

8

Menneskelig gennemgang

Gennemgå alle detektioner, tilsidesæt falske positiver og godkend før anonymisering

9

Anvend anonymisering

Vælg metode: Erstat, Rediger, Hash, Krypter eller Maskér

10

Outputdokument

Download dit anonymiserede dokument

MCP Server: Privacy-først AI-integration

Sådan håndteres dine data i MCP Server for at sikre AI-værktøjer

MCP Server fungerer som et privatlivsskjold, opfanger forespørgsler fra AI-værktøjer, anonymiserer PII, behandler sikre data gennem AI og kan om nødvendigt gendanne de oprindelige værdier.

AI-værktøjsforespørgsel

Dit AI-værktøj (Cursor, Claude) sender en forespørgsel med PII

MCP Server opfanger

Serveren analyserer og detekterer alle PII-entities

Anonymisering

PII erstattes med tokens eller redigeres

AI-behandling

AI modtager og behandler kun anonymiserede data

Svar returneres

AI-svaret returneres via MCP Server

De-tokenisering

Valgfrit: Oprindelige værdier gendannes for brugeren

Ofte stillede spørgsmål

Bruger cloak.business AI til detektion?

Nej. Detektionen bruger deterministiske regex-mønstre og NLP-modeller (spaCy, Stanza). Dette sikrer 100% reproducerbare resultater — samme input giver altid samme output, i modsætning til probabilistiske AI-tilgange.

Hvorfor regex-mønstre i stedet for AI?

Regex-mønstre er reviderbare, reproducerbare og compliant. Du kan inspicere præcis, hvad hvert mønster matcher. AI-baseret detektion er ikke-deterministisk — resultater kan variere mellem kørsel, hvilket gør compliance-dokumentation vanskelig.

Hvor præcis er detektionen?

Med 317 brugerdefinerede mønstergenkendere inkl. kontrolciffervalidering (Luhn, IBAN, SSN) opnår cloak.business markant højere nøjagtighed end generiske NER-modeller, især for strukturerede identifikatorer som kreditkort, skatte-ID’er og nationale ID-numre.

Hvilke sprog understøttes?

48 sprog understøttes med dedikerede NLP-modeller til navnegenkendelse. Mønsterbaseret detektion (regex) virker på alle sprog, da den matcher tegnmønstre uanset sprog.

Kan jeg tilføje brugerdefinerede entity-mønstre?

Ja. API’et understøtter brugerdefinerede genkenderdefinitioner, så du kan tilføje mønstre for proprietære identifikatorer, interne referencenumre eller domænespecifikke dataformater.

Se det i praksis

Prøv vores PII-detektion og anonymisering gratis med 200 tokens pr. cyklus.