Slik fungerer cloak.business | Regex-basert PII-deteksjon

Regex-basert PII-deteksjon: 317 deterministiske mønstergjenkjennere for strukturerte data (ID-er, skattenumre, kredittkort), samt spaCy, Stanza og XLM-RoBERTa NLP for navn og steder på tvers av 48 språk.

Prøv gratis Teknisk dokumentasjon

Regex-basert: Hvorfor det er viktig

Vår tilnærming: Regex + NLP

317 regex-gjenkjennere: 100 % reproduserbart for strukturerte data
NLP for navn og steder med tillitspoeng
Fullt etterprøvbart — hver deteksjon kan spores til et mønster eller en modell
Transparent: du vet alltid hva som ble matchet og hvorfor
Rask og forutsigbar ytelse
48 språk på tvers av 3 NLP-motorer

Kun AI-baserte tilnærminger

Alle deteksjoner er probabilistiske
Kan ikke forklare hvorfor noe ble flagget
Krever store treningsdatasett
Vanskelig å etterprøve for samsvar
Høyere beregningskostnader (GPU kreves)
Modelldrift svekker nøyaktigheten over tid

Den 10-trinns prosessen

Fra input til output – dette skjer med dokumentet ditt

Inputtekst

Send inn dokumentet ditt via webgrensesnitt, API eller Office-tillegg

Språkdeteksjon

Systemet identifiserer dokumentets språk for optimal behandling

Tokenisering

Teksten deles opp i tokens for mønstermatching

Mønstermatching

317 regex-gjenkjennere og NLP-modeller skanner etter 317 enhetstyper i over 70 land

Kontekstanalyse

Omgivende tekst forbedrer deteksjonsnøyaktigheten

Tillitspoeng

Hver deteksjon får en tillitsscore (0,0–1,0) som muliggjør vurdering av menneskelig gjennomgang

Enhetsklassifisering

Oppdagede elementer kategoriseres etter type

Manuell gjennomgang

Gjennomgå alle deteksjoner, overstyr falske positiver og godkjenn før anonymisering

Anonymisering

Velg metode: Erstatt, sladd, hash, krypter eller masker

Utdata-dokument

Last ned ditt anonymiserte dokument

MCP Server: Personvern-først AI-integrasjon

Slik flyter dataene dine gjennom MCP Server for å sikre AI-verktøy

MCP Server fungerer som et personvernskjold, fanger opp forespørsler fra AI-verktøy, anonymiserer PII, prosesserer trygge data gjennom AI og kan om ønskelig gjenopprette originalverdier.

AI-verktøyforespørsel

Ditt AI-verktøy (Cursor, Claude) sender en forespørsel som inneholder PII

MCP Server fanger opp

Serveren analyserer og oppdager alle PII-enheter

Anonymisering

PII erstattes med tokens eller sladdes

AI-behandling

AI mottar og behandler kun anonymiserte data

Respons returneres

AI-responsen kommer tilbake via MCP Server

De-tokenisering

Valgfritt: Originalverdier gjenopprettes for brukeren

Les mer om MCP Server →

Utforsk mer

Teknologi

Fordyp deg i regex-basert deteksjon og hvorfor det gir bedre samsvar

Arkitektur

Systemarkitektur og hvordan komponentene samhandler

Sikkerhet

Fem sikkerhetslag beskytter dine data i alle ledd

Ofte stilte spørsmål

Bruker cloak.business AI for deteksjon?

Nei. Deteksjon bruker deterministiske regex-mønstre og NLP-modeller (spaCy, Stanza). Dette sikrer 100 % reproduserbare resultater — samme input gir alltid samme output, i motsetning til probabilistiske AI-tilnærminger.

Hvorfor regex-mønstre i stedet for AI?

Regex-mønstre er etterprøvbare, reproduserbare og samsvarende. Du kan inspisere nøyaktig hva hvert mønster matcher. AI-basert deteksjon er ikke-deterministisk — resultater kan variere mellom kjøringer, noe som gjør dokumentasjon for samsvar vanskelig.

Hvor nøyaktig er deteksjonen?

Med 317 tilpassede mønstergjenkjennere inkludert kontrollsiffer-validering (Luhn, IBAN, SSN), oppnår cloak.business betydelig høyere nøyaktighet enn generiske NER-modeller, spesielt for strukturerte identifikatorer som kredittkort, skatte-ID-er og nasjonale ID-numre.

Hvilke språk støttes?

48 språk støttes med dedikerte NLP-modeller for navnegjenkjenning. Mønsterbasert deteksjon (regex) fungerer på alle språk siden den matcher tegnmønstre uavhengig av språk.

Kan jeg legge til egne enhetsmønstre?

Ja. API-et støtter egendefinerte gjenkjennerdefinisjoner slik at du kan legge til mønstre for proprietære identifikatorer, interne referansenummer eller domenespesifikke dataformater.

Se det i praksis

Prøv vår PII-deteksjon og anonymisering gratis med 200 tokens per syklus.