Regex-First: Mengapa Penting
Pendekatan Kami: Regex + NLP
- 317 pengenal regex: 100% dapat direproduksi untuk data terstruktur
- NLP untuk nama & lokasi dengan skor keyakinan
- Sepenuhnya dapat diaudit — setiap deteksi dapat dilacak ke pola atau model
- Transparan: Anda selalu tahu apa yang cocok dan alasannya
- Performa cepat dan dapat diprediksi
- 48 bahasa dengan 3 mesin NLP
Pendekatan Hanya AI
- Semua deteksi bersifat probabilistik
- Tidak dapat menjelaskan alasan penandaan
- Membutuhkan dataset pelatihan besar
- Sulit diaudit untuk kepatuhan
- Biaya komputasi lebih tinggi (butuh GPU)
- Model drift menurunkan akurasi seiring waktu
Proses 10 Langkah
Dari input hingga output, berikut yang terjadi pada dokumen Anda
Input Teks
Kirim dokumen Anda melalui antarmuka web, API, atau Office Add-in
Deteksi Bahasa
Sistem mengidentifikasi bahasa dokumen untuk pemrosesan optimal
Tokenisasi
Teks dipecah menjadi token untuk pencocokan pola
Pencocokan Pola
317 pengenal regex dan model NLP memindai lebih dari 320 tipe entitas di 70+ negara
Analisis Konteks
Teks di sekitar meningkatkan akurasi deteksi
Skor Keyakinan
Setiap deteksi menerima skor keyakinan (0.0–1.0) untuk mendukung keputusan tinjauan manusia
Klasifikasi Entitas
Item yang terdeteksi dikategorikan berdasarkan tipe
Tinjauan oleh Manusia
Tinjau semua deteksi, koreksi positif palsu, dan setujui sebelum anonimisasi
Terapkan Anonimisasi
Pilih metode Anda: Ganti, Redaksi, Hash, Enkripsi, atau Masking
Dokumen Output
Unduh dokumen yang telah dianonimkan
MCP Server: Integrasi AI Berbasis Privasi
Bagaimana data Anda mengalir melalui MCP Server untuk menjaga keamanan alat AI
MCP Server bertindak sebagai pelindung privasi, mencegat permintaan dari alat AI, menganonimkan PII, memproses data aman melalui AI, dan secara opsional mengembalikan nilai asli.
Permintaan Alat AI
Alat AI Anda (Cursor, Claude) mengirim permintaan yang berisi PII
MCP Server Mencegat
Server menganalisis dan mendeteksi semua entitas PII
Anonimisasi
PII diganti dengan token atau disunting
Pemrosesan AI
AI menerima dan memproses hanya data yang telah dianonimkan
Pengembalian Respons
Respons AI dikembalikan melalui MCP Server
De-tokenisasi
Opsional: Nilai asli dikembalikan untuk pengguna
Pertanyaan yang Sering Diajukan
Apakah cloak.business menggunakan AI untuk deteksi?
Tidak. Deteksi menggunakan pola regex deterministik dan model NLP (spaCy, Stanza). Ini memastikan hasil 100% dapat direproduksi — input yang sama selalu menghasilkan output yang sama, berbeda dengan pendekatan AI probabilistik.
Mengapa pola regex, bukan AI?
Pola regex dapat diaudit, direproduksi, dan patuh. Anda dapat memeriksa secara persis apa yang dicocokkan setiap pola. Deteksi berbasis AI bersifat non-deterministik — hasil dapat berbeda setiap kali dijalankan, sehingga dokumentasi kepatuhan menjadi sulit.
Seberapa akurat deteksinya?
Dengan 317 pengenal pola khusus termasuk validasi checksum (Luhn, IBAN, SSN), cloak.business mencapai akurasi jauh lebih tinggi dibanding model NER umum, terutama untuk pengenal terstruktur seperti kartu kredit, ID pajak, dan nomor identitas nasional.
Bahasa apa saja yang didukung?
48 bahasa didukung dengan model NLP khusus untuk pengenalan entitas bernama. Deteksi berbasis pola (regex) bekerja di semua bahasa karena mencocokkan pola karakter tanpa tergantung bahasa.
Bisakah saya menambah pola entitas khusus?
Ya. API mendukung definisi pengenal khusus sehingga Anda dapat menambah pola untuk pengenal kepemilikan, nomor referensi internal, atau format data khusus domain.