38
OCR 语言
317
实体类型
10+
图像格式
95%+
检测率
图像编辑的工作原理
从上传到编辑输出仅需几秒
1
上传图像
上传扫描文档、照片或屏幕截图
2
OCR 处理
Tesseract 提取文本和字符位置
3
PII 检测
我们的引擎使用 317 个正则表达式识别器和 NLP 识别 317 多种实体类型
4
编辑和下载
PII 用彩色边框覆盖
图像编辑功能
基于 Tesseract OCR 的企业级图像匿名化
Tesseract OCR 检测
行业标准的 OCR 引擎提取文本,并提供字符级定位以实现精确的边框编辑。
38 种 OCR 语言
完整的 Tesseract 语言包支持,包括拉丁文、斯拉夫文、CJK、阿拉伯文和天城文。
317 实体类型
使用 317 个正则表达式识别器和 NLP 检测姓名、日期、地址、电话号码、IBAN、国家身份证、税号等,覆盖 70 多个国家。
批处理
一次处理整个文件夹的扫描文档,支持并行 OCR 和编辑。
自动方向
在 OCR 之前自动应用 EXIF 方向元数据,以处理旋转或翻转的图像。
多格式支持
处理 PNG、JPEG、TIFF、BMP、WebP 和其他常见图像格式,并支持自动转换。
支持的格式
图像格式
- PNG
- JPEG / JPG
- TIFF
- BMP
- WebP
- GIF
文档扫描
- 扫描的 PDF(光栅化)
- 传真文档
- 拍摄的合同
- 身份证扫描
屏幕截图
- 桌面屏幕截图
- 移动捕获
- 浏览器屏幕截图
- 应用程序窗口
常见问题
OCR 检测的准确性如何?
Tesseract OCR 在干净的高分辨率文档上实现了 95% 以上的准确性。低质量扫描可能会降低准确性。我们会自动应用 EXIF 方向校正和图像预处理,以优化结果。
支持哪些图像格式?
我们支持 PNG、JPEG、TIFF、BMP、WebP 和 GIF 格式。扫描的 PDF 将光栅化并作为图像处理。每个图像的最大文件大小为 10MB,最大分辨率为 150 兆像素。
有哪些 OCR 语言可用?
安装了 38 个 Tesseract 语言包,包括英语、德语、法语、西班牙语、意大利语、葡萄牙语、荷兰语、波兰语、俄语、中文、日语、韩语、阿拉伯语、印地语等 24 种语言。
我可以一次处理多个图像吗?
可以!所有计划都支持批处理。免费层允许每批 5 张图像,专业计划 25 张,企业计划 100 张。图像将并行处理,以获得最大速度。
Is This Right for You?
Best For
- ✦Scanned documents, passports, and ID cards requiring OCR-based PII removal
- ✦Medical records and invoices with embedded patient or financial data
- ✦HIPAA-compliance workflows that must redact images before sharing
- ✦Batch redaction of static image archives (PNG, JPEG, PDF pages)
- ✦Legal and HR teams handling documents with mixed text and photos
Not Ideal For
- ✦Real-time video streams — frame-by-frame redaction is not supported
- ✦GIF or WebP formats — only PNG, JPEG, BMP, and TIFF are accepted
- ✦Sub-second latency requirements — OCR processing adds 0.5–3s per image
- ✦Handwritten text — OCR accuracy drops significantly vs. printed text