Regex-fyrst: Af hverju skiptir það máli
Okkar nálgun: Regex + NLP
- 317 regex-greinarar: 100% endurtekningarhæft fyrir uppbyggð gögn
- NLP fyrir nöfn og staðsetningar með öryggisstigum
- Að fullu rekjanlegt — hver greining má rekja til mynsturs eða líkans
- Gagnsætt: Þér er alltaf ljóst hvað fannst og hvers vegna
- Hröð, fyrirsjáanleg afköst
- 48 tungumál yfir 3 NLP vélar
Aðeins AI-nálganir
- Allar greiningar eru líkindabundnar
- Ekki hægt að útskýra hvers vegna eitthvað var merkt
- Krefst stórra þjálfunargagna
- Erfitt að rekja fyrir samræmi
- Hærri útreikningskostnaður (þarf GPU)
- Líkanreki dregur úr nákvæmni með tímanum
10 skrefa ferlið
Frá inntaki til úttaks — svona fer skjölin þín í gegnum kerfið
Setja inn texta
Senda inn skjal í gegnum vefviðmót, API eða Office viðbót
Tungumálagreining
Kerfið greinir tungumál skjalsins fyrir bestu úrvinnslu
Tokenization
Texta er skipt í einingar fyrir mynsturleit
Mynsturleit
317 regex-greinarar og NLP líkön leita að yfir 320 einingategundum í 70+ löndum
Samhengisgreining
Texti í kring eykur nákvæmni greiningar
Öryggisstig
Hver greining fær öryggisstig (0,0–1,0) sem gerir mannlega yfirferð mögulega
Flokkun eininga
Greind atriði eru flokkuð eftir tegund
Mannleg yfirferð
Yfirfara allar greiningar, leiðrétta rangar jákvæðar og samþykkja áður en nafnlausun fer fram
Beita nafnlausun
Veldu aðferð: Skipta út, afmá, hasha, dulkóða eða gríma
Úttaksskjöl
Sækja nafnlaust skjal
MCP þjónn: Persónuvernd fyrst í AI samþættingu
Hvernig gögnin þín fara í gegnum MCP þjóninn til að tryggja öryggi AI verkfæra
MCP þjónninn virkar sem persónuverndarskjöldur, grípur fyrirspurnir frá AI verkfærum, nafnlausar PII, vinnur örugg gögn í gegnum AI og getur eftir þörfum endurheimt upprunaleg gildi.
AI verkfæri senda beiðni
AI verkfærið þitt (Cursor, Claude) sendir beiðni sem inniheldur PII
MCP þjónn grípur inn í
Þjónninn greinir og finnur allar PII einingar
Nafnlausun
PII er skipt út fyrir tákn eða afmáð
AI úrvinnsla
AI fær og vinnur aðeins með nafnlaus gögn
Svörun til baka
AI svar kemur til baka í gegnum MCP þjóninn
Endurheimt tákna
Valfrjálst: Upprunaleg gildi endurheimt fyrir notanda
Algengar spurningar
Notar cloak.business AI til greiningar?
Nei. Greining notar ákveðin regex-mynstur og NLP líkön (spaCy, Stanza). Þetta tryggir 100% endurtekningarhæfar niðurstöður — sama inntak skilar alltaf sömu útkomu, ólíkt líkindabundnum AI aðferðum.
Af hverju regex-mynstur í stað AI?
Regex-mynstur eru rekjanleg, endurtekningarhæf og samræmanleg. Þú getur skoðað nákvæmlega hvað hvert mynstur passar við. AI-grundvölluð greining er ekki ákveðin — niðurstöður geta verið mismunandi milli keyrslna, sem gerir skjalfestingu fyrir samræmi erfiða.
Hversu nákvæm er greiningin?
Með 317 sérsniðnum mynstragreinarum, þar á meðal reiknistoðfestingu (Luhn, IBAN, SSN), nær cloak.business mun meiri nákvæmni en almenn NER líkön, sérstaklega fyrir uppbyggð auðkenni eins og kreditkort, skattnúmer og þjóðarnúmer.
Hvaða tungumál eru studd?
48 tungumál eru studd með sérhæfðum NLP líkönum fyrir nafnagreiningu. Mynsturgrunduð greining (regex) virkar yfir öll tungumál þar sem hún byggir á stafatáknum óháð tungumáli.
Get ég bætt við eigin einingamynstrum?
Já. API styður sérsniðnar greiningarskilgreiningar svo þú getur bætt við mynstrum fyrir innanhús auðkenni, tilvísunarnúmer eða sértæk gagnasnið.