Kuvan salauksenpurku — PII kuvissa

Tunnista ja poista automaattisesti henkilötiedot skannatuista asiakirjoista, valokuvista ja näyttökaappauksista. Tesseract OCR:n tuella ja 38 kielen tuella.

Kokeile ilmaiseksi Näytä dokumentaatio

LIVE

contract_review.txt0/7 PII

TokenizeReplace each value with its entity-type marker

Hyvä Aino Virtanen, Koskien tilikyselyäsi lähettäjältä 15. tammikuuta 2026, olemme vahvistaneet henkilöllisyytesi sähköpostilla aino.v@posti.fija puhelin +358 40 555 0143. Rekisteröity osoitteesi osoitteessa Mannerheimintie 14, 00100 Helsinkion vahvistettu. Siirrä erääntynyt saldo tilille DE89 3704 0044 0532 0130 00. Ystävällisin terveisin, Eero Korhonen

PERSONEMAILPHONEADDRESSDATEIBAN

Aino VirtanenPERSON<PERSON>PERSON**** ********PERSON█████████████PERSONJapb JucfgdgqPERSON15. tammikuuta 2026DATE<DATE>DATE**. ********** ****DATE████████████████DATE22. bbcwrtgpxm 2222DATEaino.v@posti.fiEMAIL<EMAIL>EMAIL****.*@*****.**EMAIL███████████████EMAILbgnj.f@kuppv.vxEMAIL+358 40 555 0143PHONE<PHONE>PHONE+*** ** *** ****PHONE████████████████PHONE+222 22 322 2222PHONEMannerheimintie 14, 00100 HelsinkiADDRESS<ADDRESS>ADDRESS*************** **, ***** ********ADDRESS████████████████ADDRESSJfxxhhjdqaakmwh 22, 22222 SnqfsawzADDRESSDE89 3704 0044 0532 0130 00IBAN<IBAN>IBAN**** **** **** **** **** **IBAN████████████████IBANSA22 2222 2222 2222 2222 22IBANEero KorhonenPERSON<PERSON>PERSON**** ********PERSON█████████████PERSONAycp JgbyddwjPERSON

OCR-kielet

Entiteettityypit

Kuvan muodot

Havaitsemisaste

Kuinka kuvan salauksenpurku toimii

Latausyöstä salauksenpurettuun tulokseen sekunneissa

Lataa kuva

Lataa skannattu asiakirja, valokuva tai näyttökaappaus

OCR-käsittely

Tesseract purkaa tekstin ja merkkiasemut

PII-tunnistus

Moottorisi tunnistaa 317 entiteettityyppiä käyttäen 317 regex-tunnistinta ja NLP

Poista ja lataa

PII peitetään värillisillä rajoitusviivoilla

Kuvan salauksenpurku-ominaisuudet

Yritystason kuvanonymisaatio Tesseract OCR:lle rakennettu

Tesseract OCR -tunnistus

Teollisuuden standardi OCR-moottori purkaa tekstin tarkka merkkiasemalla tarkkaa rajoitusviivan poistoa varten.

38 OCR-kieltä

Koko Tesseract-kielipakin tuki mukaan lukien Latin, kyrillinen, CJK, arabia ja Devanagari-kirjoitukset.

317 entiteettityyppiä

Tunnista nimet, päivämäärät, osoitteet, puhelinnumerot, IBAN-koodit, kansalliset tunnukset, veronumerot ja paljon muuta yli 70 maassa 317 regex-tunnistimen ja NLP:n avulla.

Erityöskentely

Käsittele kokonaisia kansioita skannattuja asiakirjoja kerralla rinnakkaisen OCR:n ja poiston avulla.

Automaattinen suunta

EXIF-suuntametatiedot sovelletaan automaattisesti ennen OCR:ää käsitellä pyöritettyjä tai käännettyä kuvia.

Monien muotojen tuki

Käsittele PNG, JPEG, TIFF, BMP, WebP ja muita yleisiä kuvan muotoja automaattisella muunnoksella.

Tuetut muodot

Kuvan muodot

PNG
JPEG / JPG
TIFF
BMP
WebP
GIF

Asiakirjan skanaus

Skannattu PDF (rasteroitu)
Faksi-asiakirjat
Valokuvatut sopimukset
ID-kortin skanaus

Näyttökaappaukset

Työpöydän näyttökaappaukset
Mobiilikaappaukset
Selain-näyttökaappaukset
Sovellusikkunat

Usein kysytyt kysymykset

Kuinka tarkka on OCR-tunnistus?

Tesseract OCR saavuttaa 95%+ tarkkuuden puhtailla, korkeaResolution-asiakirjoilla. Huonompikuntoiset skanaukset voivat heikentää tarkkuutta. Sovellamme automaattisesti EXIF-suunnan korjausta ja kuvan esikäsittelyä tulosten optimoimiseksi.

Mitkä kuvan muodot ovat tuettuja?

Tuemme PNG, JPEG, TIFF, BMP, WebP ja GIF-muotoja. Skannattu PDF rasteroidaan ja käsitellään kuvina. Enimmäistiedostokoko on 10 MB per kuva, suurin resoluutio 150 megapikseliä.

Mitkä OCR-kielet ovat saatavilla?

38 Tesseract-kielipakki on asennettu sisältäen englannin, saksan, ranskan, espanjan, italian, portugalilaisen, hollannin, puolalaisen, venäläisen, kiinan, japanilaisen, korealaisen, arabian, hindin ja 24 muuta.

Voinko käsitellä useita kuvia kerralla?

Kyllä! Erityöskentely on käytettävissä kaikissa suunnitelmissa. Ilmainen taso sallii 5 kuvaa per erä, ammattilainen 25 ja Enterprise 100. Kuvia käsitellään rinnakkain maksimaalisen nopeuden saavuttamiseksi.

Is This Right for You?

Best For

✦Scanned documents, passports, and ID cards requiring OCR-based PII removal
✦Medical records and invoices with embedded patient or financial data
✦HIPAA-compliance workflows that must redact images before sharing
✦Batch redaction of static image archives (PNG, JPEG, PDF pages)
✦Legal and HR teams handling documents with mixed text and photos

Not Ideal For

✦Real-time video streams — frame-by-frame redaction is not supported
✦GIF or WebP formats — only PNG, JPEG, BMP, and TIFF are accepted
✦Sub-second latency requirements — OCR processing adds 0.5–3s per image
✦Handwritten text — OCR accuracy drops significantly vs. printed text

Aloita kuvan poistaminen tänään

Kokeile kuvan poistamista ilmaiseksi 200 tunnuksella per sykli. Luottokorttia ei vaadita.

Kuvan salauksenpurku — PII kuvissa

Kuinka kuvan salauksenpurku toimii

Lataa kuva

OCR-käsittely

PII-tunnistus

Poista ja lataa

Kuvan salauksenpurku-ominaisuudet

Tesseract OCR -tunnistus

38 OCR-kieltä

317 entiteettityyppiä

Erityöskentely

Automaattinen suunta

Monien muotojen tuki

Tuetut muodot

Kuvan muodot

Asiakirjan skanaus

Näyttökaappaukset

Usein kysytyt kysymykset

Kuinka tarkka on OCR-tunnistus?

Mitkä kuvan muodot ovat tuettuja?

Mitkä OCR-kielet ovat saatavilla?

Voinko käsitellä useita kuvia kerralla?

Is This Right for You?

Best For

Not Ideal For

Related Articles

How to Detect PII in Documents

Why 317 Pattern Recognizers Beat 30

Regex vs. ML Models for PII Detection

Aloita kuvan poistaminen tänään