48개 언어 지원
전체 플랫폼에서의 전체 PII 탐지 및 익명화
spaCy NLP - 로컬 실행 (25개 언어)
Stanza NER - 로컬 실행 (7개 언어)
XLM-RoBERTa Transformer - 로컬 실행 (16개 언어)
RTL 지원
고급 NLP로 구동
최대 언어 커버리지를 위해 함께 작동하는 세 가지 NLP 엔진
- 메모리 효율성을 위한 지연 로드 모델 (최대 5개 캐시)
- 자동 언어 감지
- 혼합 언어 문서 처리
- 언어별 엔티티 패턴
국가별 형식
각 국가 및 지역에 특정한 형식의 PII를 탐지합니다.
유럽 형식
- 독일: Personalausweis, Steuer-ID, Reisepass
- 프랑스: NIR, Carte Nationale, Permis
- 이탈리아: Codice Fiscale, Carta d'Identità
- 스페인: DNI, NIE, NIF
- 네덜란드: BSN, Rijbewijs
- 폴란드: PESEL, NIP, REGON
아시아-태평양 형식
- 일본: My Number, Passport
- 인도: Aadhaar, PAN, GSTIN, Vehicle Registration
- 태국: National ID, Tax ID, Passport
- 인도네시아: NIK, NPWP, Passport
- 베트남: CCCD, Tax Code, Passport
- 말레이시아: MyKad, Tax ID, Passport
미주, 아프리카 및 중동
- 미국: SSN, Driver's License, Passport
- 영국: National Insurance, NHS Number
- 캐나다: SIN, Driver's License
- 호주: TFN, Medicare, ABN
- 케냐: National ID, KRA PIN, Passport
- 남아프리카: ID Number, Tax Number, Passport
자주 묻는 질문
cloak.business는 어떤 48개 언어를 지원하나요?
cloak.business는 아프리칸스어, 아랍어, 아르메니아어, 바스크어, 벵골어, 불가리아어, 카탈로니아어, 중국어, 크로아티아어, 체코어, 덴마크어, 네덜란드어, 영어, 에스토니아어, 핀란드어, 프랑스어, 독일어, 그리스어, 히브리어, 힌디어, 헝가리어, 아이슬란드어, 인도네시아어, 이탈리아어, 일본어, 한국어, 라트비아어, 리투아니아어, 마케도니아어, 말레이어, 노르웨이어, 페르시아어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 세르비아어, 슬로바키아어, 슬로베니아어, 스페인어, 스와힐리어, 스웨덴어, 타갈로그어, 태국어, 터키어, 우크라이나어, 우르두어, 베트남어를 지원하며, 아랍어, 히브리어, 페르시아어, 우르두어에 대한 전체 RTL 지원을 제공합니다.
모든 언어에서 PII 탐지가 동일하게 작동하나요?
탐지는 두 가지 접근 방식을 사용합니다: 구조화된 데이터(ID, 전화번호, 세금 번호)에 대한 정규식 기반 패턴 매칭과 비구조화된 엔티티(이름, 위치)에 대한 NLP 모델입니다. 패턴 기반 탐지는 48개 언어 모두를 포괄합니다. NLP 기반 탐지는 훈련된 모델이 있는 언어에서 가능합니다.
국가별 ID 형식은 어떻게 처리되나요?
cloak.business는 70개 이상의 국가를 포괄하는 317개의 패턴 인식기를 포함합니다. 각 인식기는 해당 국가의 국가 ID, 세금 번호, 건강 식별자 및 금융 데이터의 특정 형식, 체크섬 및 구조를 검증합니다.
하나의 문서에서 여러 언어의 PII를 탐지할 수 있나요?
네. cloak.business는 다국어 문서를 처리하고 단일 요청에서 여러 언어의 PII를 탐지할 수 있습니다. 시스템은 자동으로 적용할 언어 패턴을 식별합니다.
새로운 언어나 엔티티 유형에 대한 지원을 추가하려면 어떻게 해야 하나요?
정규식 패턴이나 거부 목록을 사용하여 사용자 정의 엔티티 인식기를 생성할 수 있습니다. 이를 통해 도메인별 식별자를 추가하거나 아직 내장 인식기 라이브러리에 포함되지 않은 추가 형식으로 커버리지를 확장할 수 있습니다.
Explore Related Features
Multi-language detection works seamlessly with all cloak.business products.
Chrome Extension
Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.
PII Anonymization API
REST API with JavaScript and Python SDKs. Full multi-language support built in.
Reversible Encryption
Encrypt PII with AES-256-GCM and restore original data anytime with your key.
Is This Right for You?
Best For
- ✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
- ✦Translation and localization agencies that process PII-containing content in multiple languages
- ✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
- ✦Legal discovery and compliance teams working with 48 supported language jurisdictions
Not Ideal For
- ✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
- ✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
- ✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only