cloak.business

Cara Kerja cloak.business

Deteksi PII berbasis regex: 317 pengenal pola deterministik untuk data terstruktur (ID, nomor pajak, kartu kredit), serta spaCy, Stanza, dan XLM-RoBERTa NLP untuk nama dan lokasi di 48 bahasa.

Regex-First: Mengapa Penting

Pendekatan Kami: Regex + NLP

  • 317 pengenal regex: 100% dapat direproduksi untuk data terstruktur
  • NLP untuk nama & lokasi dengan skor keyakinan
  • Sepenuhnya dapat diaudit — setiap deteksi dapat dilacak ke pola atau model
  • Transparan: Anda selalu tahu apa yang cocok dan alasannya
  • Performa cepat dan dapat diprediksi
  • 48 bahasa dengan 3 mesin NLP

Pendekatan Hanya AI

  • Semua deteksi bersifat probabilistik
  • Tidak dapat menjelaskan alasan penandaan
  • Membutuhkan dataset pelatihan besar
  • Sulit diaudit untuk kepatuhan
  • Biaya komputasi lebih tinggi (butuh GPU)
  • Model drift menurunkan akurasi seiring waktu

Proses 10 Langkah

Dari input hingga output, berikut yang terjadi pada dokumen Anda

1

Input Teks

Kirim dokumen Anda melalui antarmuka web, API, atau Office Add-in

2

Deteksi Bahasa

Sistem mengidentifikasi bahasa dokumen untuk pemrosesan optimal

3

Tokenisasi

Teks dipecah menjadi token untuk pencocokan pola

4

Pencocokan Pola

317 pengenal regex dan model NLP memindai lebih dari 320 tipe entitas di 70+ negara

5

Analisis Konteks

Teks di sekitar meningkatkan akurasi deteksi

6

Skor Keyakinan

Setiap deteksi menerima skor keyakinan (0.0–1.0) untuk mendukung keputusan tinjauan manusia

7

Klasifikasi Entitas

Item yang terdeteksi dikategorikan berdasarkan tipe

8

Tinjauan oleh Manusia

Tinjau semua deteksi, koreksi positif palsu, dan setujui sebelum anonimisasi

9

Terapkan Anonimisasi

Pilih metode Anda: Ganti, Redaksi, Hash, Enkripsi, atau Masking

10

Dokumen Output

Unduh dokumen yang telah dianonimkan

MCP Server: Integrasi AI Berbasis Privasi

Bagaimana data Anda mengalir melalui MCP Server untuk menjaga keamanan alat AI

MCP Server bertindak sebagai pelindung privasi, mencegat permintaan dari alat AI, menganonimkan PII, memproses data aman melalui AI, dan secara opsional mengembalikan nilai asli.

Permintaan Alat AI

Alat AI Anda (Cursor, Claude) mengirim permintaan yang berisi PII

MCP Server Mencegat

Server menganalisis dan mendeteksi semua entitas PII

Anonimisasi

PII diganti dengan token atau disunting

Pemrosesan AI

AI menerima dan memproses hanya data yang telah dianonimkan

Pengembalian Respons

Respons AI dikembalikan melalui MCP Server

De-tokenisasi

Opsional: Nilai asli dikembalikan untuk pengguna

Pertanyaan yang Sering Diajukan

Apakah cloak.business menggunakan AI untuk deteksi?

Tidak. Deteksi menggunakan pola regex deterministik dan model NLP (spaCy, Stanza). Ini memastikan hasil 100% dapat direproduksi — input yang sama selalu menghasilkan output yang sama, berbeda dengan pendekatan AI probabilistik.

Mengapa pola regex, bukan AI?

Pola regex dapat diaudit, direproduksi, dan patuh. Anda dapat memeriksa secara persis apa yang dicocokkan setiap pola. Deteksi berbasis AI bersifat non-deterministik — hasil dapat berbeda setiap kali dijalankan, sehingga dokumentasi kepatuhan menjadi sulit.

Seberapa akurat deteksinya?

Dengan 317 pengenal pola khusus termasuk validasi checksum (Luhn, IBAN, SSN), cloak.business mencapai akurasi jauh lebih tinggi dibanding model NER umum, terutama untuk pengenal terstruktur seperti kartu kredit, ID pajak, dan nomor identitas nasional.

Bahasa apa saja yang didukung?

48 bahasa didukung dengan model NLP khusus untuk pengenalan entitas bernama. Deteksi berbasis pola (regex) bekerja di semua bahasa karena mencocokkan pola karakter tanpa tergantung bahasa.

Bisakah saya menambah pola entitas khusus?

Ya. API mendukung definisi pengenal khusus sehingga Anda dapat menambah pola untuk pengenal kepemilikan, nomor referensi internal, atau format data khusus domain.

Lihat Cara Kerjanya

Coba deteksi dan anonimisasi PII kami gratis dengan 200 token per siklus.