图像编辑 — 保护图像中的 PII

自动检测和编辑扫描文档、照片和屏幕截图中的个人信息。由 Tesseract OCR 提供支持,支持 38 种语言。

contract_review.txt
Dear Dr. Sarah Mitchell, Regarding your account inquiry from January 15, 2026, we have verified your identity using the email test.demo@example.com and phone +49 170 123 4567. Your registered address at Friedrichstr. 43, 10117 Berlin has been confirmed. Please transfer the outstanding balance to DE89 3704 0044 0532 0130 00. Best regards, Thomas Weber
38
OCR 语言
320+
实体类型
10+
图像格式
95%+
检测率

图像编辑的工作原理

从上传到编辑输出仅需几秒

1

上传图像

上传扫描文档、照片或屏幕截图

2

OCR 处理

Tesseract 提取文本和字符位置

3

PII 检测

我们的引擎使用 317 个正则表达式识别器和 NLP 识别 320 多种实体类型

4

编辑和下载

PII 用彩色边框覆盖

图像编辑功能

基于 Tesseract OCR 的企业级图像匿名化

Tesseract OCR 检测

行业标准的 OCR 引擎提取文本,并提供字符级定位以实现精确的边框编辑。

38 种 OCR 语言

完整的 Tesseract 语言包支持,包括拉丁文、斯拉夫文、CJK、阿拉伯文和天城文。

320+ 实体类型

使用 317 个正则表达式识别器和 NLP 检测姓名、日期、地址、电话号码、IBAN、国家身份证、税号等,覆盖 70 多个国家。

批处理

一次处理整个文件夹的扫描文档,支持并行 OCR 和编辑。

自动方向

在 OCR 之前自动应用 EXIF 方向元数据,以处理旋转或翻转的图像。

多格式支持

处理 PNG、JPEG、TIFF、BMP、WebP 和其他常见图像格式,并支持自动转换。

支持的格式

图像格式

  • PNG
  • JPEG / JPG
  • TIFF
  • BMP
  • WebP
  • GIF

文档扫描

  • 扫描的 PDF(光栅化)
  • 传真文档
  • 拍摄的合同
  • 身份证扫描

屏幕截图

  • 桌面屏幕截图
  • 移动捕获
  • 浏览器屏幕截图
  • 应用程序窗口

常见问题

OCR 检测的准确性如何?

Tesseract OCR 在干净的高分辨率文档上实现了 95% 以上的准确性。低质量扫描可能会降低准确性。我们会自动应用 EXIF 方向校正和图像预处理,以优化结果。

支持哪些图像格式?

我们支持 PNG、JPEG、TIFF、BMP、WebP 和 GIF 格式。扫描的 PDF 将光栅化并作为图像处理。每个图像的最大文件大小为 10MB,最大分辨率为 150 兆像素。

有哪些 OCR 语言可用?

安装了 38 个 Tesseract 语言包,包括英语、德语、法语、西班牙语、意大利语、葡萄牙语、荷兰语、波兰语、俄语、中文、日语、韩语、阿拉伯语、印地语等 24 种语言。

我可以一次处理多个图像吗?

可以!所有计划都支持批处理。免费层允许每批 5 张图像,专业计划 25 张,企业计划 100 张。图像将并行处理,以获得最大速度。

Is This Right for You?

Best For

  • Scanned documents, passports, and ID cards requiring OCR-based PII removal
  • Medical records and invoices with embedded patient or financial data
  • HIPAA-compliance workflows that must redact images before sharing
  • Batch redaction of static image archives (PNG, JPEG, PDF pages)
  • Legal and HR teams handling documents with mixed text and photos

Not Ideal For

  • Real-time video streams — frame-by-frame redaction is not supported
  • GIF or WebP formats — only PNG, JPEG, BMP, and TIFF are accepted
  • Sub-second latency requirements — OCR processing adds 0.5–3s per image
  • Handwritten text — OCR accuracy drops significantly vs. printed text

今天开始编辑图像

免费试用图像编辑,每个周期 200 个令牌。无需信用卡。