Regex-basert: Hvorfor det er viktig
Vår tilnærming: Regex + NLP
- 317 regex-gjenkjennere: 100 % reproduserbart for strukturerte data
- NLP for navn og steder med tillitspoeng
- Fullt etterprøvbart — hver deteksjon kan spores til et mønster eller en modell
- Transparent: du vet alltid hva som ble matchet og hvorfor
- Rask og forutsigbar ytelse
- 48 språk på tvers av 3 NLP-motorer
Kun AI-baserte tilnærminger
- Alle deteksjoner er probabilistiske
- Kan ikke forklare hvorfor noe ble flagget
- Krever store treningsdatasett
- Vanskelig å etterprøve for samsvar
- Høyere beregningskostnader (GPU kreves)
- Modelldrift svekker nøyaktigheten over tid
Den 10-trinns prosessen
Fra input til output – dette skjer med dokumentet ditt
Inputtekst
Send inn dokumentet ditt via webgrensesnitt, API eller Office-tillegg
Språkdeteksjon
Systemet identifiserer dokumentets språk for optimal behandling
Tokenisering
Teksten deles opp i tokens for mønstermatching
Mønstermatching
317 regex-gjenkjennere og NLP-modeller skanner etter 320+ enhetstyper i over 70 land
Kontekstanalyse
Omgivende tekst forbedrer deteksjonsnøyaktigheten
Tillitspoeng
Hver deteksjon får en tillitsscore (0,0–1,0) som muliggjør vurdering av menneskelig gjennomgang
Enhetsklassifisering
Oppdagede elementer kategoriseres etter type
Manuell gjennomgang
Gjennomgå alle deteksjoner, overstyr falske positiver og godkjenn før anonymisering
Anonymisering
Velg metode: Erstatt, sladd, hash, krypter eller masker
Utdata-dokument
Last ned ditt anonymiserte dokument
MCP Server: Personvern-først AI-integrasjon
Slik flyter dataene dine gjennom MCP Server for å sikre AI-verktøy
MCP Server fungerer som et personvernskjold, fanger opp forespørsler fra AI-verktøy, anonymiserer PII, prosesserer trygge data gjennom AI og kan om ønskelig gjenopprette originalverdier.
AI-verktøyforespørsel
Ditt AI-verktøy (Cursor, Claude) sender en forespørsel som inneholder PII
MCP Server fanger opp
Serveren analyserer og oppdager alle PII-enheter
Anonymisering
PII erstattes med tokens eller sladdes
AI-behandling
AI mottar og behandler kun anonymiserte data
Respons returneres
AI-responsen kommer tilbake via MCP Server
De-tokenisering
Valgfritt: Originalverdier gjenopprettes for brukeren
Ofte stilte spørsmål
Bruker cloak.business AI for deteksjon?
Nei. Deteksjon bruker deterministiske regex-mønstre og NLP-modeller (spaCy, Stanza). Dette sikrer 100 % reproduserbare resultater — samme input gir alltid samme output, i motsetning til probabilistiske AI-tilnærminger.
Hvorfor regex-mønstre i stedet for AI?
Regex-mønstre er etterprøvbare, reproduserbare og samsvarende. Du kan inspisere nøyaktig hva hvert mønster matcher. AI-basert deteksjon er ikke-deterministisk — resultater kan variere mellom kjøringer, noe som gjør dokumentasjon for samsvar vanskelig.
Hvor nøyaktig er deteksjonen?
Med 317 tilpassede mønstergjenkjennere inkludert kontrollsiffer-validering (Luhn, IBAN, SSN), oppnår cloak.business betydelig høyere nøyaktighet enn generiske NER-modeller, spesielt for strukturerte identifikatorer som kredittkort, skatte-ID-er og nasjonale ID-numre.
Hvilke språk støttes?
48 språk støttes med dedikerte NLP-modeller for navnegjenkjenning. Mønsterbasert deteksjon (regex) fungerer på alle språk siden den matcher tegnmønstre uavhengig av språk.
Kan jeg legge til egne enhetsmønstre?
Ja. API-et støtter egendefinerte gjenkjennerdefinisjoner slik at du kan legge til mønstre for proprietære identifikatorer, interne referansenummer eller domenespesifikke dataformater.