Regex-baseret: Hvorfor det er vigtigt
Vores tilgang: Regex + NLP
- 317 regex-genkendere: 100% reproducerbare for strukturerede data
- NLP til navne & lokationer med tillidsscorer
- Fuldstændig reviderbar — hver detektion kan spores til et mønster eller en model
- Gennemsigtighed: du ved altid, hvad der blev matchet og hvorfor
- Hurtig, forudsigelig ydeevne
- 48 sprog på tværs af 3 NLP-motorer
AI-baserede tilgange
- Alle detektioner er probabilistiske
- Kan ikke forklare, hvorfor noget blev markeret
- Kræver store træningsdatasæt
- Svært at revidere for compliance
- Højere beregningsomkostninger (GPU krævet)
- Modeldrift forringer nøjagtighed over tid
Processen i 10 trin
Fra input til output – sådan behandles dit dokument
Indtast tekst
Indsend dit dokument via webgrænseflade, API eller Office Add-in
Sprogdetektion
Systemet identificerer dokumentets sprog for optimal behandling
Tokenisering
Teksten opdeles i tokens til mønstergenkendelse
Mønstergenkendelse
317 regex-genkendere og NLP-modeller scanner efter 320+ entity-typer i 70+ lande
Kontekstanalyse
Omgivende tekst forbedrer detektionsnøjagtigheden
Tillidsscore
Hver detektion får en tillidsscore (0,0–1,0), som muliggør menneskelig gennemgang
Entitetsklassificering
Detekterede elementer kategoriseres efter type
Menneskelig gennemgang
Gennemgå alle detektioner, tilsidesæt falske positiver og godkend før anonymisering
Anvend anonymisering
Vælg metode: Erstat, Rediger, Hash, Krypter eller Maskér
Outputdokument
Download dit anonymiserede dokument
MCP Server: Privacy-først AI-integration
Sådan håndteres dine data i MCP Server for at sikre AI-værktøjer
MCP Server fungerer som et privatlivsskjold, opfanger forespørgsler fra AI-værktøjer, anonymiserer PII, behandler sikre data gennem AI og kan om nødvendigt gendanne de oprindelige værdier.
AI-værktøjsforespørgsel
Dit AI-værktøj (Cursor, Claude) sender en forespørgsel med PII
MCP Server opfanger
Serveren analyserer og detekterer alle PII-entities
Anonymisering
PII erstattes med tokens eller redigeres
AI-behandling
AI modtager og behandler kun anonymiserede data
Svar returneres
AI-svaret returneres via MCP Server
De-tokenisering
Valgfrit: Oprindelige værdier gendannes for brugeren
Ofte stillede spørgsmål
Bruger cloak.business AI til detektion?
Nej. Detektionen bruger deterministiske regex-mønstre og NLP-modeller (spaCy, Stanza). Dette sikrer 100% reproducerbare resultater — samme input giver altid samme output, i modsætning til probabilistiske AI-tilgange.
Hvorfor regex-mønstre i stedet for AI?
Regex-mønstre er reviderbare, reproducerbare og compliant. Du kan inspicere præcis, hvad hvert mønster matcher. AI-baseret detektion er ikke-deterministisk — resultater kan variere mellem kørsel, hvilket gør compliance-dokumentation vanskelig.
Hvor præcis er detektionen?
Med 317 brugerdefinerede mønstergenkendere inkl. kontrolciffervalidering (Luhn, IBAN, SSN) opnår cloak.business markant højere nøjagtighed end generiske NER-modeller, især for strukturerede identifikatorer som kreditkort, skatte-ID’er og nationale ID-numre.
Hvilke sprog understøttes?
48 sprog understøttes med dedikerede NLP-modeller til navnegenkendelse. Mønsterbaseret detektion (regex) virker på alle sprog, da den matcher tegnmønstre uanset sprog.
Kan jeg tilføje brugerdefinerede entity-mønstre?
Ja. API’et understøtter brugerdefinerede genkenderdefinitioner, så du kan tilføje mønstre for proprietære identifikatorer, interne referencenumre eller domænespecifikke dataformater.