Kuvan salauksenpurku — PII kuvissa
Tunnista ja poista automaattisesti henkilötiedot skannatuista asiakirjoista, valokuvista ja näyttökaappauksista. Tesseract OCR:n tuella ja 38 kielen tuella.
Kuinka kuvan salauksenpurku toimii
Latausyöstä salauksenpurettuun tulokseen sekunneissa
Lataa kuva
Lataa skannattu asiakirja, valokuva tai näyttökaappaus
OCR-käsittely
Tesseract purkaa tekstin ja merkkiasemut
PII-tunnistus
Moottorisi tunnistaa 320+ entiteettityyppiä käyttäen 317 regex-tunnistinta ja NLP
Poista ja lataa
PII peitetään värillisillä rajoitusviivoilla
Kuvan salauksenpurku-ominaisuudet
Yritystason kuvanonymisaatio Tesseract OCR:lle rakennettu
Tesseract OCR -tunnistus
Teollisuuden standardi OCR-moottori purkaa tekstin tarkka merkkiasemalla tarkkaa rajoitusviivan poistoa varten.
38 OCR-kieltä
Koko Tesseract-kielipakin tuki mukaan lukien Latin, kyrillinen, CJK, arabia ja Devanagari-kirjoitukset.
320+ entiteettityyppiä
Tunnista nimet, päivämäärät, osoitteet, puhelinnumerot, IBAN-koodit, kansalliset tunnukset, veronumerot ja paljon muuta yli 70 maassa 317 regex-tunnistimen ja NLP:n avulla.
Erityöskentely
Käsittele kokonaisia kansioita skannattuja asiakirjoja kerralla rinnakkaisen OCR:n ja poiston avulla.
Automaattinen suunta
EXIF-suuntametatiedot sovelletaan automaattisesti ennen OCR:ää käsitellä pyöritettyjä tai käännettyä kuvia.
Monien muotojen tuki
Käsittele PNG, JPEG, TIFF, BMP, WebP ja muita yleisiä kuvan muotoja automaattisella muunnoksella.
Tuetut muodot
Kuvan muodot
- PNG
- JPEG / JPG
- TIFF
- BMP
- WebP
- GIF
Asiakirjan skanaus
- Skannattu PDF (rasteroitu)
- Faksi-asiakirjat
- Valokuvatut sopimukset
- ID-kortin skanaus
Näyttökaappaukset
- Työpöydän näyttökaappaukset
- Mobiilikaappaukset
- Selain-näyttökaappaukset
- Sovellusikkunat
Usein kysytyt kysymykset
Kuinka tarkka on OCR-tunnistus?
Tesseract OCR saavuttaa 95%+ tarkkuuden puhtailla, korkeaResolution-asiakirjoilla. Huonompikuntoiset skanaukset voivat heikentää tarkkuutta. Sovellamme automaattisesti EXIF-suunnan korjausta ja kuvan esikäsittelyä tulosten optimoimiseksi.
Mitkä kuvan muodot ovat tuettuja?
Tuemme PNG, JPEG, TIFF, BMP, WebP ja GIF-muotoja. Skannattu PDF rasteroidaan ja käsitellään kuvina. Enimmäistiedostokoko on 10 MB per kuva, suurin resoluutio 150 megapikseliä.
Mitkä OCR-kielet ovat saatavilla?
38 Tesseract-kielipakki on asennettu sisältäen englannin, saksan, ranskan, espanjan, italian, portugalilaisen, hollannin, puolalaisen, venäläisen, kiinan, japanilaisen, korealaisen, arabian, hindin ja 24 muuta.
Voinko käsitellä useita kuvia kerralla?
Kyllä! Erityöskentely on käytettävissä kaikissa suunnitelmissa. Ilmainen taso sallii 5 kuvaa per erä, ammattilainen 25 ja Enterprise 100. Kuvia käsitellään rinnakkain maksimaalisen nopeuden saavuttamiseksi.
Is This Right for You?
Best For
- ✦Scanned documents, passports, and ID cards requiring OCR-based PII removal
- ✦Medical records and invoices with embedded patient or financial data
- ✦HIPAA-compliance workflows that must redact images before sharing
- ✦Batch redaction of static image archives (PNG, JPEG, PDF pages)
- ✦Legal and HR teams handling documents with mixed text and photos
Not Ideal For
- ✦Real-time video streams — frame-by-frame redaction is not supported
- ✦GIF or WebP formats — only PNG, JPEG, BMP, and TIFF are accepted
- ✦Sub-second latency requirements — OCR processing adds 0.5–3s per image
- ✦Handwritten text — OCR accuracy drops significantly vs. printed text