系统架构
基于 Microsoft Presidio,架构将分析、匿名化和处理分离为专用服务,确保最大可靠性。
核心组件
分析服务
通过 317 个自定义正则识别器(正则表达式)检测结构化数据(如证件号、税号),并结合 spaCy/Stanza/XLM-RoBERTa NLP 识别人名与地名。所有模型均在自有服务器运行——数据绝不发送至第三方 AI 提供商。返回实体位置、类型及置信分数。
匿名化服务
应用您选择的转换方式。支持替换、遮盖、哈希、加密和掩码。
网页应用
Next.js 前端,实时处理。适配所有设备。
REST API
RESTful 接口,支持程序化访问。JWT 身份验证。限流。
数据流转
文档在安全、可审计的流程中通过各服务流转。
- 1
客户端通过 HTTPS 发送文档
- 2
分析服务检测 PII 实体
- 3
返回包含位置和分数的结果
- 4
客户端选择匿名化方式
- 5
匿名化服务执行转换
- 6
匿名化文档返回客户端