图像编辑 — 保护图像中的 PII

自动检测和编辑扫描文档、照片和屏幕截图中的个人信息。由 Tesseract OCR 提供支持，支持 38 种语言。

LIVE

contract_review.txt0/7 PII

TokenizeReplace each value with its entity-type marker

親愛的李娜，關於您來自2026年1月15日的帳戶查詢，我們已透過電子郵件lina@youjian.cn驗證了您的身分。和電話+86 138 5550 1430。您的註冊地址為北京市东城区长安街14号已被確認。請將未結餘額轉至DE89 3704 0044 0532 0130 00。最好的問候，王伟

PERSONEMAILPHONEADDRESSDATEIBAN

李娜PERSON<PERSON>PERSON**PERSON████████PERSONqgPERSON2026年1月15日DATE<DATE>DATE**********DATE██████████DATE2222z2e22hDATElina@youjian.cnEMAIL<EMAIL>EMAIL****@*******.**EMAIL███████████████EMAILnpuv@ypdjrxb.axEMAIL+86 138 5550 1430PHONE<PHONE>PHONE+** *** **** ****PHONE████████████████PHONE+22 222 2222 2222PHONE北京市东城区长安街14号ADDRESS<ADDRESS>ADDRESS************ADDRESS████████████ADDRESSuqhdmebgj22sADDRESSDE89 3704 0044 0532 0130 00IBAN<IBAN>IBAN**** **** **** **** **** **IBAN████████████████IBANSA22 2222 2222 2222 2222 22IBAN王伟PERSON<PERSON>PERSON**PERSON████████PERSONgbPERSON

OCR 语言

实体类型

图像格式

检测率

图像编辑的工作原理

从上传到编辑输出仅需几秒

上传图像

上传扫描文档、照片或屏幕截图

OCR 处理

Tesseract 提取文本和字符位置

PII 检测

我们的引擎使用 317 个正则表达式识别器和 NLP 识别 317 多种实体类型

编辑和下载

PII 用彩色边框覆盖

图像编辑功能

基于 Tesseract OCR 的企业级图像匿名化

Tesseract OCR 检测

行业标准的 OCR 引擎提取文本，并提供字符级定位以实现精确的边框编辑。

38 种 OCR 语言

完整的 Tesseract 语言包支持，包括拉丁文、斯拉夫文、CJK、阿拉伯文和天城文。

317 实体类型

使用 317 个正则表达式识别器和 NLP 检测姓名、日期、地址、电话号码、IBAN、国家身份证、税号等，覆盖 70 多个国家。

批处理

一次处理整个文件夹的扫描文档，支持并行 OCR 和编辑。

自动方向

在 OCR 之前自动应用 EXIF 方向元数据，以处理旋转或翻转的图像。

多格式支持

处理 PNG、JPEG、TIFF、BMP、WebP 和其他常见图像格式，并支持自动转换。

支持的格式

图像格式

PNG
JPEG / JPG
TIFF
BMP
WebP
GIF

文档扫描

扫描的 PDF（光栅化）
传真文档
拍摄的合同
身份证扫描

屏幕截图

桌面屏幕截图
移动捕获
浏览器屏幕截图
应用程序窗口

常见问题

OCR 检测的准确性如何？

Tesseract OCR 在干净的高分辨率文档上实现了 95% 以上的准确性。低质量扫描可能会降低准确性。我们会自动应用 EXIF 方向校正和图像预处理，以优化结果。

支持哪些图像格式？

我们支持 PNG、JPEG、TIFF、BMP、WebP 和 GIF 格式。扫描的 PDF 将光栅化并作为图像处理。每个图像的最大文件大小为 10MB，最大分辨率为 150 兆像素。

有哪些 OCR 语言可用？

安装了 38 个 Tesseract 语言包，包括英语、德语、法语、西班牙语、意大利语、葡萄牙语、荷兰语、波兰语、俄语、中文、日语、韩语、阿拉伯语、印地语等 24 种语言。

我可以一次处理多个图像吗？

可以！所有计划都支持批处理。免费层允许每批 5 张图像，专业计划 25 张，企业计划 100 张。图像将并行处理，以获得最大速度。

Is This Right for You?

Best For

✦Scanned documents, passports, and ID cards requiring OCR-based PII removal
✦Medical records and invoices with embedded patient or financial data
✦HIPAA-compliance workflows that must redact images before sharing
✦Batch redaction of static image archives (PNG, JPEG, PDF pages)
✦Legal and HR teams handling documents with mixed text and photos

Not Ideal For

✦Real-time video streams — frame-by-frame redaction is not supported
✦GIF or WebP formats — only PNG, JPEG, BMP, and TIFF are accepted
✦Sub-second latency requirements — OCR processing adds 0.5–3s per image
✦Handwritten text — OCR accuracy drops significantly vs. printed text

今天开始编辑图像

免费试用图像编辑，每个周期 200 个令牌。无需信用卡。

图像编辑 — 保护图像中的 PII

图像编辑的工作原理

上传图像

OCR 处理

PII 检测

编辑和下载

图像编辑功能

Tesseract OCR 检测

38 种 OCR 语言

317 实体类型

批处理

自动方向

多格式支持

支持的格式

图像格式

文档扫描

屏幕截图

常见问题

OCR 检测的准确性如何？

支持哪些图像格式？

有哪些 OCR 语言可用？

我可以一次处理多个图像吗？

Is This Right for You?

Best For

Not Ideal For

Related Articles

How to Detect PII in Documents

Why 317 Pattern Recognizers Beat 30

Regex vs. ML Models for PII Detection

今天开始编辑图像