Cara Kerja Deteksi
Pencocokan Pola Regex (PII Terstruktur)
317 PatternRecognizers khusus dengan pola regex mendeteksi data terstruktur seperti ID nasional, nomor pajak, paspor, dan SIM. Setiap pola menggunakan batasan untuk mencegah kecocokan palsu dalam kode atau data terstruktur.
Pengenalan Entitas Bernama NLP (Nama & Lokasi)
spaCy (25 bahasa), Stanza NER (7 bahasa), dan transformer XLM-RoBERTa (16 bahasa) mendeteksi PII tidak terstruktur seperti nama orang, lokasi, dan organisasi yang tidak dapat ditangkap oleh regex saja. Semua model dijalankan di server kami sendiri di Jerman — tidak ada data yang pernah dikirim ke Meta, Google, Stanford, atau pihak ketiga mana pun.
Penilaian Kepercayaan
Setiap deteksi menyertakan skor kepercayaan (0.0–1.0) untuk keputusan manusia dalam loop. Format yang sangat spesifik (misalnya, IBAN Jerman DE89 3704 0044 0532 0130 00) mendapatkan skor 0.85+, sementara pola digit generik mendapatkan skor 0.3–0.5 dan bergantung pada kata konteks untuk konfirmasi. Tim kepatuhan dapat meninjau dan mengesampingkan deteksi sebelum anonimisasi.
Analisis Kata Konteks
Setiap pengenal memiliki kata konteks dalam bahasa yang relevan (misalnya, 'Personalausweis' untuk ID Jerman, 'kitambulisho' untuk ID Kenya). Ketika kata konteks muncul di dekat kecocokan, skor kepercayaan ditingkatkan.
Jenis Entitas yang Didukung
Cakupan komprehensif jenis informasi pribadi di berbagai kategori
Pengenal Pribadi
- Nama Orang
- Alamat Email
- Nomor Telepon
- Tanggal Lahir
- Usia
- Jenis Kelamin
- Kebangsaan
Informasi Keuangan
- Nomor Kartu Kredit
- IBAN
- BIC/SWIFT
- Nomor Rekening Bank
- ID Pajak
- Nomor PPN
ID Pemerintah
- Nomor Jaminan Sosial (SSN)
- Nomor ID Nasional
- Nomor Paspor
- SIM
- ID Asuransi Kesehatan
Data Lokasi
- Alamat Jalan
- Kota
- Kode Pos
- Negara
- Koordinat GPS
Pengenal Digital
- Alamat IP (v4/v6)
- Alamat MAC
- URL
- Nama Domain
- ID Pengguna
Data Organisasi
- Nama Perusahaan
- ID Organisasi
- Nomor Registrasi
- Nama Departemen
Data Temporal
- Tanggal
- Waktu
- Rentang Tanggal
- Cap Waktu
Format Internasional
- ID Jerman (Personalausweis)
- Asuransi Nasional Inggris
- DNI/NIE Spanyol
- Codice Fiscale Italia
- Dan lebih dari 70 format spesifik negara lainnya
Dukungan Entitas Kustom
Perlu mendeteksi pola kustom? Buat jenis entitas Anda sendiri dengan pola regex atau gunakan generator pola berbantuan AI kami.
Pembuatan Pola Manual
Tentukan pola regex untuk pengenal kepemilikan seperti ID karyawan internal, kode proyek, atau nomor referensi kustom.
Generator Pola AI
Jelaskan apa yang ingin Anda deteksi dalam bahasa sederhana, dan AI kami akan menghasilkan pola regex yang dioptimalkan untuk Anda.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient