Mengapa Regex-First?
Untuk kepatuhan regulasi, Anda memerlukan hasil yang dapat dijelaskan dan direproduksi. Pendekatan regex-first kami menjaga deteksi data terstruktur tetap deterministik, sementara NLP menangani nama dan lokasi dengan skor keyakinan yang transparan.
Perbandingan Detail
| Regex-First (Kami) | Berbasis AI/ML | |
|---|---|---|
| Reproduksibilitas | Data terstruktur: 100% identik. Nama: skor keyakinan | Semua hasil bervariasi setiap kali dijalankan |
| Auditabilitas | Setiap deteksi dapat dilacak ke pola atau model NLP | Black box — tidak dapat menjelaskan keputusan |
| Data Pelatihan | Regex: tidak ada. NLP: model pre-trained disertakan | Membutuhkan dataset pelatihan khusus |
| Model Drift | Regex: tidak ada. NLP: model versi stabil | Menurun secara tak terduga seiring waktu |
| Performa | Cepat, hanya CPU | Bervariasi, bergantung pada GPU |
| Biaya Komputasi | Rendah (hanya CPU) | Tinggi (sering butuh GPU) |
| Kepatuhan Regulasi | Mudah — pola + skor keyakinan dapat diaudit dengan pengawasan manusia | Sulit dibuktikan ke regulator |
Cara Kerja Pencocokan Pola
Setiap tipe entitas memiliki pola regex khusus yang disusun untuk mencocokkan format tertentu.
Alamat Email
Mencocokkan format email standar: local-part@domain.tld
Nomor Kartu Kredit
Mencocokkan format Visa, Mastercard, Amex, dan kartu lain dengan validasi Luhn
IBAN Jerman
Mencocokkan format IBAN Jerman dengan spasi opsional
Dibangun untuk Kepatuhan
Ketika auditor bertanya "mengapa ini terdeteksi?" Anda memerlukan jawaban yang jelas. Deteksi regex dapat dilacak ke pola tertentu. Deteksi NLP mencakup nama model dan skor keyakinan. Tinjauan manusia memastikan tim kepatuhan dapat mengoreksi deteksi sebelum anonimisasi.
- GDPR Pasal 25: Privasi sejak desain dengan pemrosesan yang dapat dijelaskan
- ISO 27001: Proses terdokumentasi dan dapat diulang
- Audit Trail: Setiap deteksi dapat dilacak ke pola tertentu
Contoh Tanggapan Audit
T: Mengapa "john.smith@company.com" ditandai?
J: Cocok dengan pola email pada posisi 45-68 dengan keyakinan 0.95. Pola: validasi format email standar.