48 भाषाओं में PII पहचान

मूल पैटर्न समर्थन के साथ 48 भाषाओं में PII का पता लगाएं और गुमनाम करें। अरबी, हिब्रू, फारसी और उर्दू के लिए पूर्ण RTL समर्थन।

मुफ्त में आज़माएं भाषा दस्तावेज़ीकरण

48 भाषाएँ समर्थित

पूरे प्लेटफ़ॉर्म में पूर्ण PII पहचान और गुमनामी

spaCy NLP - स्थानीय रूप से चलता है (25 भाषाएँ)

अंग्रेजीजर्मनस्पेनिशफ्रेंचइटालियनपुर्तगालीडचपोलिशरूसीजापानीचीनीकोरियाईरोमानियाईग्रीकक्रोएशियाईस्लोवेनियाईमैसिडोनियनस्वीडिशडेनिशनॉर्वेजियनफिनिशयूक्रेनीलिथुआनियाईकैटलनतुर्की

Stanza NER - स्थानीय रूप से चलता है (7 भाषाएँ)

बुल्गारियनहंगेरियनहिब्रू (RTL)वियतनामीअफ्रीकान्सआर्मेनियाईबास्क

XLM-RoBERTa ट्रांसफार्मर - स्थानीय रूप से चलता है (16 भाषाएँ)

अरबी (RTL)हिंदीचेकस्लोवाकइंडोनेशियाईथाईफारसी (RTL)सर्बियाईलातवियाईएस्टोनियाईमलयबंगालीउर्दू (RTL)स्वाहिलीटागालोगआइसलैंडिक

RTL समर्थन

अरबीहिब्रूफारसीउर्दू

उन्नत NLP द्वारा संचालित

अधिकतम भाषा कवरेज के लिए तीन NLP इंजन मिलकर काम कर रहे हैं

मेमोरी दक्षता के लिए लेज़ी-लोडेड मॉडल (अधिकतम 5 कैश्ड)
स्वचालित भाषा पहचान
मिश्रित-भाषा दस्तावेज़ प्रसंस्करण
भाषा-विशिष्ट इकाई पैटर्न

देश-विशिष्ट प्रारूप

हम प्रत्येक देश और क्षेत्र के लिए विशिष्ट प्रारूपों में PII का पता लगाते हैं।

यूरोपीय प्रारूप

जर्मन: Personalausweis, Steuer-ID, Reisepass
फ्रेंच: NIR, Carte Nationale, Permis
इटालियन: Codice Fiscale, Carta d'Identità
स्पेनिश: DNI, NIE, NIF
डच: BSN, Rijbewijs
पोलिश: PESEL, NIP, REGON

एशिया-प्रशांत प्रारूप

जापान: My Number, Passport
भारत: आधार, PAN, GSTIN, वाहन पंजीकरण
थाईलैंड: राष्ट्रीय आईडी, कर आईडी, पासपोर्ट
इंडोनेशिया: NIK, NPWP, पासपोर्ट
वियतनाम: CCCD, कर कोड, पासपोर्ट
मलेशिया: MyKad, कर आईडी, पासपोर्ट

अमेरिका, अफ्रीका और मध्य पूर्व

अमेरिका: SSN, ड्राइवर का लाइसेंस, पासपोर्ट
यूके: राष्ट्रीय बीमा, NHS नंबर
कनाडा: SIN, ड्राइवर का लाइसेंस
ऑस्ट्रेलिया: TFN, मेडिकेयर, ABN
केन्या: राष्ट्रीय आईडी, KRA पिन, पासपोर्ट
दक्षिण अफ्रीका: आईडी नंबर, कर नंबर, पासपोर्ट

अक्सर पूछे जाने वाले प्रश्न

cloak.business कौन सी 48 भाषाओं का समर्थन करता है?

cloak.business अफ्रीकान्स, अरबी, आर्मेनियाई, बास्क, बंगाली, बुल्गारियन, कैटलन, चीनी, क्रोएशियाई, चेक, डेनिश, डच, अंग्रेजी, एस्टोनियाई, फिनिश, फ्रेंच, जर्मन, ग्रीक, हिब्रू, हिंदी, हंगेरियन, आइसलैंडिक, इंडोनेशियाई, इटालियन, जापानी, कोरियाई, लातवियाई, लिथुआनियाई, मैसिडोनियन, मलय, नॉर्वेजियन, फारसी, पोलिश, पुर्तगाली, रोमानियाई, रूसी, सर्बियाई, स्लोवाक, स्लोवेनियाई, स्पेनिश, स्वाहिली, स्वीडिश, टागालोग, थाई, तुर्की, यूक्रेनी, उर्दू, और वियतनामी का समर्थन करता है — अरबी, हिब्रू, फारसी और उर्दू के लिए पूर्ण RTL समर्थन के साथ।

क्या सभी भाषाओं में PII पहचान समान रूप से काम करती है?

पहचान दो दृष्टिकोणों का उपयोग करती है: संरचित डेटा (आईडी, फोन नंबर, कर नंबर) के लिए रेगुलर एक्सप्रेशन-आधारित पैटर्न मिलान और असंरचित संस्थाओं (नाम, स्थान) के लिए NLP मॉडल। पैटर्न-आधारित पहचान सभी 48 भाषाओं को कवर करती है। NLP-आधारित पहचान उन भाषाओं में उपलब्ध है जिनमें प्रशिक्षित मॉडल हैं।

देश-विशिष्ट आईडी प्रारूप कैसे संभाले जाते हैं?

cloak.business में 70+ देशों को कवर करने वाले 317 पैटर्न पहचानकर्ता शामिल हैं। प्रत्येक पहचानकर्ता उस देश के राष्ट्रीय आईडी, कर नंबर, स्वास्थ्य पहचानकर्ता और वित्तीय डेटा के विशिष्ट प्रारूप, चेकसम और संरचना को मान्य करता है।

क्या मैं एक ही दस्तावेज़ में कई भाषाओं में PII का पता लगा सकता हूँ?

हाँ। cloak.business बहुभाषी दस्तावेज़ों को संसाधित कर सकता है और एक ही अनुरोध में विभिन्न भाषाओं में PII का पता लगा सकता है। प्रणाली स्वचालित रूप से पहचानती है कि कौन से भाषा पैटर्न लागू करने हैं।

मैं नई भाषा या इकाई प्रकार के लिए समर्थन कैसे जोड़ सकता हूँ?

आप रेगुलर एक्सप्रेशन पैटर्न या अस्वीकार सूचियों का उपयोग करके कस्टम इकाई पहचानकर्ता बना सकते हैं। यह आपको डोमेन-विशिष्ट पहचानकर्ता जोड़ने या अंतर्निहित पहचानकर्ता लाइब्रेरी में अभी तक शामिल नहीं किए गए अतिरिक्त प्रारूपों के लिए कवरेज का विस्तार करने की अनुमति देता है।

Explore Related Features

Multi-language detection works seamlessly with all cloak.business products.

Chrome Extension

Anonymize AI prompts in ChatGPT, Claude, Gemini, and 3 more AI platforms — in any of 48 supported languages.

PII Anonymization API

REST API with JavaScript and Python SDKs. Full multi-language support built in.

Reversible Encryption

Encrypt PII with AES-256-GCM and restore original data anytime with your key.

Is This Right for You?

Best For

✦Global enterprises with multilingual document workflows requiring consistent GDPR and privacy compliance
✦Translation and localization agencies that process PII-containing content in multiple languages
✦Government agencies and NGOs processing citizen data across EU, APAC, and LATAM jurisdictions
✦Legal discovery and compliance teams working with 48 supported language jurisdictions

Not Ideal For

✦Monolingual English-only workflows — the standard plan is sufficient without the overhead of language detection
✦Languages not in the supported 48 — check the entity catalog for specific language and entity coverage
✦Real-time sub-10ms latency requirements — language detection adds processing overhead over English-only

किसी भी भाषा में गुमनाम करें

200 मुफ्त टोकन के साथ शुरू करें। सभी 48 भाषाओं के साथ काम करता है।