为什么选择正则表达式,而不是AI?
我们的方式
- 100%可重复的结果
- 完全可审计以确保合规性
- 不需要训练数据
- 透明的决策过程
- 快速、可预测的性能
- 没有模型漂移
AI/ML方法
- 结果在不同运行之间变化
- 黑箱决策过程
- 需要训练数据
- 难以审计
- 更高的计算成本
- 模型漂移
10步流程
从输入到输出,您的文档到底发生了什么
1
输入文本
通过Web界面、API或Office插件提交您的文档
2
语言检测
系统识别文档语言以进行最佳处理
3
标记化
文本被分解为标记以进行模式匹配
4
模式匹配
正则表达式模式扫描50多种实体类型
5
上下文分析
周围文本提高检测准确性
6
置信度评分
每个检测都会获得一个置信度评分
7
实体分类
检测到的项目按类型分类
8
查看结果
查看所有检测结果及其位置和评分
9
应用匿名化
选择您的方法:替换、编辑、哈希、加密或掩码
10
输出文档
下载您的匿名化文档
MCP服务器:隐私优先的AI集成
您的数据如何通过MCP服务器流动以保持AI工具的安全
MCP服务器充当隐私屏障,拦截来自AI工具的请求,匿名化PII,通过AI处理安全数据,并可选择性地恢复原始值。
AI工具请求
您的AI工具(Cursor,Claude)发送包含PII的请求
MCP服务器拦截
服务器分析并检测所有PII实体
匿名化
PII被替换为令牌或编辑
AI处理
AI仅接收和处理匿名化数据
响应返回
AI响应通过MCP服务器返回
去令牌化
可选:为用户恢复原始值