Skip to content

AI前PII匿名化 317种PII类型

以正则表达式为核心的GDPR合规保护。317种确定性模式识别器处理结构化数据,NLP用于姓名和地点——在德国ISO 27001认证服务器上实现透明、可审计的结果。

LIVE
ISO 27001:2022
GDPR合规
德国本地托管
基于Microsoft Presidio构建

图像遮盖——您的核心功能

自动检测并遮盖扫描文件、照片和截图中的PII。基于Tesseract的OCR分析,支持38种语言。

  • 检测图像中的人脸、姓名、日期和地址
  • 38种OCR语言,自动校正方向
  • 基于实体类型的彩色边框遮盖
  • 批量处理整个文件夹的扫描文档
passport_scan.png
2.4 MB — PNG
已检测到PII12 实体
PERSONDATEADDRESSPHONE
遮盖完成

正则优先检测

317种确定性模式识别器为ID、税号、信用卡等结构化数据提供可复现结果。NLP模型补充识别姓名和地点——全部在我们位于德国的自有服务器上运行,绝不将数据发送给第三方。完全可审计,满足合规要求。

了解我们的技术

德国服务器,ISO 27001认证

所有数据处理均在Hetzner位于德国的ISO 27001认证数据中心完成。您的数据始终留在欧盟,无跨境法律风险。

查看安全详情

透明易懂的Token计费

采用透明的Token计费系统,按实际用量付费。免费套餐包含200个Token(约15页/月)。无隐藏费用,无意外支出。

查看价格
317
实体类型
48
支持语言
7
匿名化方法
99.9%
运行时SLA

全流程解决方案

无论AI对话、API、文档还是多语言环境,均可保护敏感数据

AI聊天保护

在数据发送至ChatGPT、Claude、Gemini等AI平台前先行匿名化PII。实时拦截,支持可逆加密。

保护AI对话

PII遮盖API

RESTful API,配备JavaScript和Python SDK。可编程检测与匿名化317类实体。

探索API

可逆加密

采用AES-256-GCM加密,兼顾数据可用性。可随时用个人密钥解密匿名化数据。

了解加密方式

48语言检测

支持48种语言和70+国家的PII检测。RTL支持阿拉伯语、希伯来语、波斯语和乌尔都语。

查看支持语言

工作原理

四步轻松保护文档中的敏感数据

01 輸入lina@youjian.cn

上传或粘贴

通过网页界面、API或Office插件输入文本

02 掃描lina@youjian.cn

分析

检测引擎利用正则和NLP扫描48种语言中的317类PII实体

03 分類電子郵件99%

审核

人工审核环节:查看检测结果及置信分数,纠正误报,匿名化前确认

04 CLOAK<EMAIL>

匿名化

应用所选匿名化方法并下载结果

常见问题

什么是PII检测与匿名化?

PII(个人可识别信息)检测会扫描文本中的敏感数据,如姓名、邮箱、电话、税号和护照号。匿名化则通过替换、掩码、遮盖、哈希或加密等方式处理这些实体,使数据可安全共享或处理——无需暴露个人信息。

cloak.business如何保护发送给AI聊天机器人的数据?

我们的Chrome扩展会在消息发送至ChatGPT、Claude、Gemini等AI平台前进行拦截,实时检测PII并用匿名Token替换敏感值。AI回复时,扩展会自动将值解密还原,确保您获得有用的AI答案,同时个人数据始终不被暴露。

cloak.business是否GDPR合规?

是的。所有处理均在德国ISO 27001:2022认证服务器上完成,数据绝不离开欧盟。我们的正则优先检测完全确定性且可审计,满足GDPR的透明度与问责要求。我们还支持HIPAA、PCI-DSS等合规框架。

cloak.business支持哪些语言?

我们支持48种语言,包括英语、德语、西班牙语、法语、意大利语、葡萄牙语、日语、中文、韩语、阿拉伯语、印地语等。317种基于正则的识别器覆盖70+国家的税号、国民ID、电话等本地化实体。RTL语言(阿拉伯语、希伯来语、波斯语、乌尔都语)也完全支持。

匿名化后可以还原吗?

可以——我们的加密方法采用AES-256-GCM,并使用您的个人密钥。您可随时将匿名化数据解密还原,非常适合AI流程中先匿名化再还原原始数据。其他方法(替换、掩码、遮盖、哈希)为不可逆。

如何将cloak.business集成到我的应用?

请使用我们的RESTful API,并配合官方JavaScript(npm: @cloak-business/sdk)和Python(PyPI: cloak-business)SDK。三大接口涵盖完整流程:analyze(检测PII)、anonymize(保护数据)、deanonymize(还原加密值)。免费套餐含200个Token,助您快速上手。

cloak.business可检测哪些实体类型?

覆盖70+国家的317多种实体类型,包括姓名、邮箱、电话、地址、信用卡号、IBAN、SSN、护照号、税号、驾照、国民ID、IP地址、URL等。我们采用317种基于正则的识别器处理结构化数据,并用NLP模型识别姓名和地点。

有免费套餐吗?

有。免费套餐每个账单周期含200个Token(约15–18页文本),无需信用卡。API、Chrome扩展及全部7种匿名化方法均可用。付费套餐适合更高用量,价格实惠。

准备好保护您的数据了吗?

免费套餐起步——每周期200个Token,无需信用卡。