Slik fungerer cloak.business

Regex-basert PII-deteksjon: 317 deterministiske mønstergjenkjennere for strukturerte data (ID-er, skattenumre, kredittkort), samt spaCy, Stanza og XLM-RoBERTa NLP for navn og steder på tvers av 48 språk.

Regex-basert: Hvorfor det er viktig

Vår tilnærming: Regex + NLP

  • 317 regex-gjenkjennere: 100 % reproduserbart for strukturerte data
  • NLP for navn og steder med tillitspoeng
  • Fullt etterprøvbart — hver deteksjon kan spores til et mønster eller en modell
  • Transparent: du vet alltid hva som ble matchet og hvorfor
  • Rask og forutsigbar ytelse
  • 48 språk på tvers av 3 NLP-motorer

Kun AI-baserte tilnærminger

  • Alle deteksjoner er probabilistiske
  • Kan ikke forklare hvorfor noe ble flagget
  • Krever store treningsdatasett
  • Vanskelig å etterprøve for samsvar
  • Høyere beregningskostnader (GPU kreves)
  • Modelldrift svekker nøyaktigheten over tid

Den 10-trinns prosessen

Fra input til output – dette skjer med dokumentet ditt

1

Inputtekst

Send inn dokumentet ditt via webgrensesnitt, API eller Office-tillegg

2

Språkdeteksjon

Systemet identifiserer dokumentets språk for optimal behandling

3

Tokenisering

Teksten deles opp i tokens for mønstermatching

4

Mønstermatching

317 regex-gjenkjennere og NLP-modeller skanner etter 320+ enhetstyper i over 70 land

5

Kontekstanalyse

Omgivende tekst forbedrer deteksjonsnøyaktigheten

6

Tillitspoeng

Hver deteksjon får en tillitsscore (0,0–1,0) som muliggjør vurdering av menneskelig gjennomgang

7

Enhetsklassifisering

Oppdagede elementer kategoriseres etter type

8

Manuell gjennomgang

Gjennomgå alle deteksjoner, overstyr falske positiver og godkjenn før anonymisering

9

Anonymisering

Velg metode: Erstatt, sladd, hash, krypter eller masker

10

Utdata-dokument

Last ned ditt anonymiserte dokument

MCP Server: Personvern-først AI-integrasjon

Slik flyter dataene dine gjennom MCP Server for å sikre AI-verktøy

MCP Server fungerer som et personvernskjold, fanger opp forespørsler fra AI-verktøy, anonymiserer PII, prosesserer trygge data gjennom AI og kan om ønskelig gjenopprette originalverdier.

AI-verktøyforespørsel

Ditt AI-verktøy (Cursor, Claude) sender en forespørsel som inneholder PII

MCP Server fanger opp

Serveren analyserer og oppdager alle PII-enheter

Anonymisering

PII erstattes med tokens eller sladdes

AI-behandling

AI mottar og behandler kun anonymiserte data

Respons returneres

AI-responsen kommer tilbake via MCP Server

De-tokenisering

Valgfritt: Originalverdier gjenopprettes for brukeren

Ofte stilte spørsmål

Bruker cloak.business AI for deteksjon?

Nei. Deteksjon bruker deterministiske regex-mønstre og NLP-modeller (spaCy, Stanza). Dette sikrer 100 % reproduserbare resultater — samme input gir alltid samme output, i motsetning til probabilistiske AI-tilnærminger.

Hvorfor regex-mønstre i stedet for AI?

Regex-mønstre er etterprøvbare, reproduserbare og samsvarende. Du kan inspisere nøyaktig hva hvert mønster matcher. AI-basert deteksjon er ikke-deterministisk — resultater kan variere mellom kjøringer, noe som gjør dokumentasjon for samsvar vanskelig.

Hvor nøyaktig er deteksjonen?

Med 317 tilpassede mønstergjenkjennere inkludert kontrollsiffer-validering (Luhn, IBAN, SSN), oppnår cloak.business betydelig høyere nøyaktighet enn generiske NER-modeller, spesielt for strukturerte identifikatorer som kredittkort, skatte-ID-er og nasjonale ID-numre.

Hvilke språk støttes?

48 språk støttes med dedikerte NLP-modeller for navnegjenkjenning. Mønsterbasert deteksjon (regex) fungerer på alle språk siden den matcher tegnmønstre uavhengig av språk.

Kan jeg legge til egne enhetsmønstre?

Ja. API-et støtter egendefinerte gjenkjennerdefinisjoner slik at du kan legge til mønstre for proprietære identifikatorer, interne referansenummer eller domenespesifikke dataformater.

Se det i praksis

Prøv vår PII-deteksjon og anonymisering gratis med 200 tokens per syklus.