cloak.business

Deteksi PII: 320+ Jenis Entitas

Mesin deteksi kami menggabungkan 317 pengenal regex khusus dengan model NLP untuk mengidentifikasi lebih dari 320 jenis informasi pribadi di lebih dari 70 negara. Input yang sama, output yang sama - setiap saat.

Cara Kerja Deteksi

Pencocokan Pola Regex (PII Terstruktur)

317 PatternRecognizers khusus dengan pola regex mendeteksi data terstruktur seperti ID nasional, nomor pajak, paspor, dan SIM. Setiap pola menggunakan batasan untuk mencegah kecocokan palsu dalam kode atau data terstruktur.

Pengenalan Entitas Bernama NLP (Nama & Lokasi)

spaCy (25 bahasa), Stanza NER (7 bahasa), dan transformer XLM-RoBERTa (16 bahasa) mendeteksi PII tidak terstruktur seperti nama orang, lokasi, dan organisasi yang tidak dapat ditangkap oleh regex saja. Semua model dijalankan di server kami sendiri di Jerman — tidak ada data yang pernah dikirim ke Meta, Google, Stanford, atau pihak ketiga mana pun.

Penilaian Kepercayaan

Setiap deteksi menyertakan skor kepercayaan (0.0–1.0) untuk keputusan manusia dalam loop. Format yang sangat spesifik (misalnya, IBAN Jerman DE89 3704 0044 0532 0130 00) mendapatkan skor 0.85+, sementara pola digit generik mendapatkan skor 0.3–0.5 dan bergantung pada kata konteks untuk konfirmasi. Tim kepatuhan dapat meninjau dan mengesampingkan deteksi sebelum anonimisasi.

Analisis Kata Konteks

Setiap pengenal memiliki kata konteks dalam bahasa yang relevan (misalnya, 'Personalausweis' untuk ID Jerman, 'kitambulisho' untuk ID Kenya). Ketika kata konteks muncul di dekat kecocokan, skor kepercayaan ditingkatkan.

Jenis Entitas yang Didukung

Cakupan komprehensif jenis informasi pribadi di berbagai kategori

Pengenal Pribadi

  • Nama Orang
  • Alamat Email
  • Nomor Telepon
  • Tanggal Lahir
  • Usia
  • Jenis Kelamin
  • Kebangsaan

Informasi Keuangan

  • Nomor Kartu Kredit
  • IBAN
  • BIC/SWIFT
  • Nomor Rekening Bank
  • ID Pajak
  • Nomor PPN

ID Pemerintah

  • Nomor Jaminan Sosial (SSN)
  • Nomor ID Nasional
  • Nomor Paspor
  • SIM
  • ID Asuransi Kesehatan

Data Lokasi

  • Alamat Jalan
  • Kota
  • Kode Pos
  • Negara
  • Koordinat GPS

Pengenal Digital

  • Alamat IP (v4/v6)
  • Alamat MAC
  • URL
  • Nama Domain
  • ID Pengguna

Data Organisasi

  • Nama Perusahaan
  • ID Organisasi
  • Nomor Registrasi
  • Nama Departemen

Data Temporal

  • Tanggal
  • Waktu
  • Rentang Tanggal
  • Cap Waktu

Format Internasional

  • ID Jerman (Personalausweis)
  • Asuransi Nasional Inggris
  • DNI/NIE Spanyol
  • Codice Fiscale Italia
  • Dan lebih dari 70 format spesifik negara lainnya

Dukungan Entitas Kustom

Perlu mendeteksi pola kustom? Buat jenis entitas Anda sendiri dengan pola regex atau gunakan generator pola berbantuan AI kami.

Pembuatan Pola Manual

Tentukan pola regex untuk pengenal kepemilikan seperti ID karyawan internal, kode proyek, atau nomor referensi kustom.

Generator Pola AI

Jelaskan apa yang ingin Anda deteksi dalam bahasa sederhana, dan AI kami akan menghasilkan pola regex yang dioptimalkan untuk Anda.

Is This Right For You?

Best For

  • Teams needing 320+ entity types across personal, financial, government, and organizational data
  • Multilingual PII detection (48 languages) for global compliance and audit requirements
  • GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
  • Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
  • Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns

Not For

  • Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
  • Image-only PII detection workflows (use the dedicated image-redaction feature instead)
  • Simple English-only use cases where basic regex or keyword matching is sufficient

Mulai Deteksi PII Hari Ini

Coba mesin deteksi kami gratis dengan 200 token per siklus. Tidak perlu kartu kredit.