面临的挑战
开发团队在真实测试数据与数据保护之间持续权衡:
- 生产数据包含敏感 PII,无法直接使用
- 合成数据往往缺乏真实感,影响测试效果
- 手动匿名化耗时且易出错
- 不同环境需保证数据一致性与可复现性
解决方案
通过 RESTful API,将 PII 匿名化直接集成到开发流程中。
REST API
简洁的 JSON API,适用于任何技术栈。一次请求即可分析并匿名化。
CI/CD 就绪
在流水线中自动生成测试数据。每次结果一致。
可复现
相同输入,输出一致。确定性结果,保障测试可靠性。
高效
每分钟可处理数千条记录。无需 GPU。
常见问题解答
如何将 cloak.business PII 检测集成到我的 CI/CD 流水线?
可通过 REST API 或官方 SDK(JavaScript/Python)调用 analyze 和 anonymize 端点,适用于任何 CI/CD 工具。API 返回确定性结果,相同输入始终生成相同 Token,适合快照测试和可复现构建。
cloak.business 能否基于生产数据生成真实的匿名化测试数据?
可以。通过 Replace 或 Encrypt 方法对生产导出数据进行匿名化,可获得结构上真实但不含真实 PII 的测试数据。Encrypt 方法可逆,授权情况下可还原原始数据用于调试。
cloak.business SDK 支持哪些编程语言?
官方 SDK 支持 JavaScript(npm: @cloak-business/sdk)和 Python(PyPI: cloak-business)。两者均支持 HTTP 429 自动重试与 Retry-After,并支持 analyze、anonymize 和 deanonymize 三个 API 端点。
Is This Right for You?
Best For
- Organizations with compliance obligations (GDPR, HIPAA, CCPA, PCI-DSS)
- Teams regularly sharing datasets containing names, IDs, or medical records
- Developers building AI pipelines that process user-submitted content
- Enterprises requiring audit logs and reproducible anonymization for legal holds
Not Ideal For
- Single-language English-only pipelines with no PII — regex-only tools may suffice
- Real-time streaming at sub-5ms latency — NLP inference adds overhead
- Fully air-gapped environments without internet access — use Desktop App instead
- Unstructured media files (audio, video) — text extraction is a prerequisite limitation