Skip to content

图像编辑 保护图像中的 PII

自动检测和编辑扫描文档、照片和屏幕截图中的个人信息。由 Tesseract OCR 提供支持,支持 38 种语言。

LIVE
38
OCR 语言
317
实体类型
10+
图像格式
95%+
检测率

图像编辑的工作原理

从上传到编辑输出仅需几秒

1

上传图像

上传扫描文档、照片或屏幕截图

2

OCR 处理

Tesseract 提取文本和字符位置

3

PII 检测

我们的引擎使用 317 个正则表达式识别器和 NLP 识别 317 多种实体类型

4

编辑和下载

PII 用彩色边框覆盖

图像编辑功能

基于 Tesseract OCR 的企业级图像匿名化

Tesseract OCR 检测

行业标准的 OCR 引擎提取文本,并提供字符级定位以实现精确的边框编辑。

38 种 OCR 语言

完整的 Tesseract 语言包支持,包括拉丁文、斯拉夫文、CJK、阿拉伯文和天城文。

317 实体类型

使用 317 个正则表达式识别器和 NLP 检测姓名、日期、地址、电话号码、IBAN、国家身份证、税号等,覆盖 70 多个国家。

批处理

一次处理整个文件夹的扫描文档,支持并行 OCR 和编辑。

自动方向

在 OCR 之前自动应用 EXIF 方向元数据,以处理旋转或翻转的图像。

多格式支持

处理 PNG、JPEG、TIFF、BMP、WebP 和其他常见图像格式,并支持自动转换。

支持的格式

图像格式

  • PNG
  • JPEG / JPG
  • TIFF
  • BMP
  • WebP
  • GIF

文档扫描

  • 扫描的 PDF(光栅化)
  • 传真文档
  • 拍摄的合同
  • 身份证扫描

屏幕截图

  • 桌面屏幕截图
  • 移动捕获
  • 浏览器屏幕截图
  • 应用程序窗口

常见问题

OCR 检测的准确性如何?

Tesseract OCR 在干净的高分辨率文档上实现了 95% 以上的准确性。低质量扫描可能会降低准确性。我们会自动应用 EXIF 方向校正和图像预处理,以优化结果。

支持哪些图像格式?

我们支持 PNG、JPEG、TIFF、BMP、WebP 和 GIF 格式。扫描的 PDF 将光栅化并作为图像处理。每个图像的最大文件大小为 10MB,最大分辨率为 150 兆像素。

有哪些 OCR 语言可用?

安装了 38 个 Tesseract 语言包,包括英语、德语、法语、西班牙语、意大利语、葡萄牙语、荷兰语、波兰语、俄语、中文、日语、韩语、阿拉伯语、印地语等 24 种语言。

我可以一次处理多个图像吗?

可以!所有计划都支持批处理。免费层允许每批 5 张图像,专业计划 25 张,企业计划 100 张。图像将并行处理,以获得最大速度。

Is This Right for You?

Best For

  • Scanned documents, passports, and ID cards requiring OCR-based PII removal
  • Medical records and invoices with embedded patient or financial data
  • HIPAA-compliance workflows that must redact images before sharing
  • Batch redaction of static image archives (PNG, JPEG, PDF pages)
  • Legal and HR teams handling documents with mixed text and photos

Not Ideal For

  • Real-time video streams — frame-by-frame redaction is not supported
  • GIF or WebP formats — only PNG, JPEG, BMP, and TIFF are accepted
  • Sub-second latency requirements — OCR processing adds 0.5–3s per image
  • Handwritten text — OCR accuracy drops significantly vs. printed text

今天开始编辑图像

免费试用图像编辑,每个周期 200 个令牌。无需信用卡。