企业级PII检测与匿名化

以正则表达式为核心的GDPR合规保护。317种确定性模式识别器处理结构化数据,NLP用于姓名和地点——在德国ISO 27001认证服务器上实现透明、可审计的结果。

contract_review.txt
Dear Dr. Sarah Mitchell, Regarding your account inquiry from January 15, 2026, we have verified your identity using the email test.demo@example.com and phone +49 170 123 4567. Your registered address at Friedrichstr. 43, 10117 Berlin has been confirmed. Please transfer the outstanding balance to DE89 3704 0044 0532 0130 00. Best regards, Thomas Weber
ISO 27001:2022
GDPR合规
德国本地托管
基于Microsoft Presidio构建

图像遮盖——您的核心功能

自动检测并遮盖扫描文件、照片和截图中的PII。基于Tesseract的OCR分析,支持38种语言。

  • 检测图像中的人脸、姓名、日期和地址
  • 38种OCR语言,自动校正方向
  • 基于实体类型的彩色边框遮盖
  • 批量处理整个文件夹的扫描文档
passport_scan.png
2.4 MB — PNG
已检测到PII12 实体
PERSONDATEADDRESSPHONE
遮盖完成

正则优先检测

317种确定性模式识别器为ID、税号、信用卡等结构化数据提供可复现结果。NLP模型补充识别姓名和地点——全部在我们位于德国的自有服务器上运行,绝不将数据发送给第三方。完全可审计,满足合规要求。

了解我们的技术

德国服务器,ISO 27001认证

所有数据处理均在Hetzner位于德国的ISO 27001认证数据中心完成。您的数据始终留在欧盟,无跨境法律风险。

查看安全详情

透明易懂的Token计费

采用透明的Token计费系统,按实际用量付费。免费套餐包含200个Token(约15页/月)。无隐藏费用,无意外支出。

查看价格
320+
实体类型
48
支持语言
7
匿名化方法
99.9%
运行时SLA

全流程解决方案

无论AI对话、API、文档还是多语言环境,均可保护敏感数据

AI聊天保护

在数据发送至ChatGPT、Claude、Gemini等AI平台前先行匿名化PII。实时拦截,支持可逆加密。

保护AI对话

PII遮盖API

RESTful API,配备JavaScript和Python SDK。可编程检测与匿名化320+类实体。

探索API

可逆加密

采用AES-256-GCM加密,兼顾数据可用性。可随时用个人密钥解密匿名化数据。

了解加密方式

48语言检测

支持48种语言和70+国家的PII检测。RTL支持阿拉伯语、希伯来语、波斯语和乌尔都语。

查看支持语言

工作原理

四步轻松保护文档中的敏感数据

1

上传或粘贴

通过网页界面、API或Office插件输入文本

2

分析

检测引擎利用正则和NLP扫描48种语言中的320+类PII实体

3

审核

人工审核环节:查看检测结果及置信分数,纠正误报,匿名化前确认

4

匿名化

应用所选匿名化方法并下载结果

常见问题

什么是PII检测与匿名化?

PII(个人可识别信息)检测会扫描文本中的敏感数据,如姓名、邮箱、电话、税号和护照号。匿名化则通过替换、掩码、遮盖、哈希或加密等方式处理这些实体,使数据可安全共享或处理——无需暴露个人信息。

cloak.business如何保护发送给AI聊天机器人的数据?

我们的Chrome扩展会在消息发送至ChatGPT、Claude、Gemini等AI平台前进行拦截,实时检测PII并用匿名Token替换敏感值。AI回复时,扩展会自动将值解密还原,确保您获得有用的AI答案,同时个人数据始终不被暴露。

cloak.business是否GDPR合规?

是的。所有处理均在德国ISO 27001:2022认证服务器上完成,数据绝不离开欧盟。我们的正则优先检测完全确定性且可审计,满足GDPR的透明度与问责要求。我们还支持HIPAA、PCI-DSS等合规框架。

cloak.business支持哪些语言?

我们支持48种语言,包括英语、德语、西班牙语、法语、意大利语、葡萄牙语、日语、中文、韩语、阿拉伯语、印地语等。317种基于正则的识别器覆盖70+国家的税号、国民ID、电话等本地化实体。RTL语言(阿拉伯语、希伯来语、波斯语、乌尔都语)也完全支持。

匿名化后可以还原吗?

可以——我们的加密方法采用AES-256-GCM,并使用您的个人密钥。您可随时将匿名化数据解密还原,非常适合AI流程中先匿名化再还原原始数据。其他方法(替换、掩码、遮盖、哈希)为不可逆。

如何将cloak.business集成到我的应用?

请使用我们的RESTful API,并配合官方JavaScript(npm: @cloak-business/sdk)和Python(PyPI: cloak-business)SDK。三大接口涵盖完整流程:analyze(检测PII)、anonymize(保护数据)、deanonymize(还原加密值)。免费套餐含200个Token,助您快速上手。

cloak.business可检测哪些实体类型?

覆盖70+国家的320多种实体类型,包括姓名、邮箱、电话、地址、信用卡号、IBAN、SSN、护照号、税号、驾照、国民ID、IP地址、URL等。我们采用317种基于正则的识别器处理结构化数据,并用NLP模型识别姓名和地点。

有免费套餐吗?

有。免费套餐每个账单周期含200个Token(约15–18页文本),无需信用卡。API、Chrome扩展及全部7种匿名化方法均可用。付费套餐适合更高用量,价格实惠。

准备好保护您的数据了吗?

免费套餐起步——每周期200个Token,无需信用卡。