cloak.business

Kamus PII & Privasi Data

Definisi yang jelas tentang istilah kunci privasi, kepatuhan, dan perlindungan data yang digunakan di seluruh industri.

Istilah Privasi & Kepatuhan

Informasi yang Dapat Diidentifikasi Secara Pribadi (PII)

Data apa pun yang dapat mengidentifikasi individu tertentu, seperti nama, alamat email, nomor jaminan sosial, atau nomor telepon.

Anonimisasi

Proses yang tidak dapat dibalik dari mengubah data sehingga individu tidak dapat diidentifikasi, baik secara langsung maupun tidak langsung.

Pseudonimisasi

Mengganti data yang dapat diidentifikasi dengan pengidentifikasi buatan (pseudonim) sehingga re-identifikasi memerlukan kunci yang disimpan secara terpisah.

De-identifikasi

Menghapus atau menyembunyikan pengidentifikasi pribadi dari data sehingga tidak dapat lagi dihubungkan dengan individu tertentu tanpa informasi tambahan.

Subjek Data

Seseorang yang teridentifikasi atau dapat diidentifikasi yang data pribadinya diproses oleh pengendali atau pemroses.

Pengendali Data

Entitas yang menentukan tujuan dan cara pemrosesan data pribadi.

Pemroses Data

Entitas yang memproses data pribadi atas nama pengendali data, mengikuti instruksi pengendali.

Persetujuan

Indikasi yang diberikan secara bebas, spesifik, terinformasi, dan tidak ambigu dari kesepakatan subjek data untuk pemrosesan data pribadi mereka.

Dasar Hukum

Dasar hukum di mana pemrosesan data pribadi diizinkan, seperti persetujuan, kebutuhan kontrak, kewajiban hukum, atau kepentingan yang sah.

Minimisasi Data

Prinsip bahwa data pribadi yang dikumpulkan harus memadai, relevan, dan terbatas pada apa yang diperlukan untuk tujuan yang dimaksud.

Hak untuk Dihapus

Hak subjek data untuk memiliki data pribadi mereka dihapus ketika tidak lagi diperlukan, juga dikenal sebagai 'hak untuk dilupakan' di bawah GDPR.

Portabilitas Data

Hak subjek data untuk menerima data pribadi mereka dalam format yang terstruktur dan umum digunakan serta untuk mentransfernya ke pengendali lain.

Petugas Perlindungan Data (DPO)

Individu yang ditunjuk bertanggung jawab untuk mengawasi strategi perlindungan data organisasi dan memastikan kepatuhan terhadap peraturan privasi.

Penilaian Dampak Perlindungan Data (DPIA)

Proses untuk mengidentifikasi dan meminimalkan risiko perlindungan data dari suatu proyek, yang diperlukan di bawah GDPR untuk aktivitas pemrosesan berisiko tinggi.

Pelanggaran Data

Insiden keamanan di mana data pribadi diakses, diungkapkan, diubah, atau dihancurkan tanpa izin.

Kerangka Regulasi

GDPR (Regulasi Perlindungan Data Umum)

Regulasi UE yang mengatur pemrosesan data pribadi individu di dalam Kawasan Ekonomi Eropa, berlaku sejak Mei 2018.

CCPA (Undang-Undang Privasi Konsumen California)

Undang-undang negara bagian California yang memberikan hak kepada konsumen atas informasi pribadi mereka yang dikumpulkan oleh bisnis, berlaku sejak Januari 2020.

HIPAA (Undang-Undang Portabilitas dan Akuntabilitas Asuransi Kesehatan)

Undang-undang federal AS yang menetapkan standar untuk melindungi informasi kesehatan pasien yang sensitif dari pengungkapan tanpa persetujuan.

ISO 27001

Standar internasional untuk sistem manajemen keamanan informasi (ISMS), yang menetapkan persyaratan untuk mendirikan, menerapkan, dan terus meningkatkan kontrol keamanan.

SOC 2 (Kontrol Sistem dan Organisasi 2)

Kerangka audit untuk organisasi layanan yang mengevaluasi kontrol terkait keamanan, ketersediaan, integritas pemrosesan, kerahasiaan, dan privasi.

Istilah Teknis

Pengenalan Entitas Bernama (NER)

Teknik NLP yang mengidentifikasi dan mengklasifikasikan entitas bernama dalam teks ke dalam kategori yang telah ditentukan seperti nama orang, lokasi, dan organisasi.

Pemrosesan Bahasa Alami (NLP)

Sebuah cabang kecerdasan buatan yang memungkinkan komputer untuk memahami, menginterpretasikan, dan menghasilkan bahasa manusia.

Pengenal Pola

Detektor berbasis aturan yang menggunakan ekspresi reguler dan petunjuk konteks untuk mengidentifikasi pola data tertentu, seperti nomor kartu kredit atau nomor jaminan sosial.

Skor Kepercayaan

Nilai numerik antara 0 dan 1 yang menunjukkan seberapa yakin mesin deteksi bahwa sepotong teks cocok dengan jenis entitas tertentu.

Ekspresi Reguler (Regex)

Urutan karakter yang mendefinisikan pola pencarian, biasanya digunakan untuk memvalidasi dan mendeteksi format data terstruktur seperti nomor telepon atau alamat email.

AES-256-GCM

Algoritma enkripsi terautentikasi yang menggunakan kunci 256-bit dengan Mode Galois/Counter, memberikan baik kerahasiaan maupun verifikasi integritas data yang dienkripsi.

Enkripsi Zero-Knowledge

Arsitektur enkripsi di mana hanya pengguna yang memegang kunci dekripsi, yang berarti bahkan penyedia layanan tidak dapat mengakses data plaintext.

Tokenisasi

Mengganti data sensitif dengan token pengganti yang tidak sensitif yang dapat dipetakan kembali ke data asli melalui pencarian yang aman.

Masking Data

Menyembunyikan data tertentu dalam dataset sehingga informasi sensitif tersembunyi sementara data tetap dapat digunakan untuk pengujian atau analisis.

Redaksi

Penghapusan permanen informasi sensitif dari dokumen atau dataset, menggantinya dengan penanda seperti [REDACTED].

Metode Anonimisasi

Ganti

Mengganti PII yang terdeteksi dengan pengganti generik dari jenis entitas yang sama, seperti mengganti 'John Smith' dengan '<PERSON>'.

Masker

Sebagian menyembunyikan PII dengan mengganti karakter dengan simbol pemaskingan, misalnya mengubah '123-45-6789' menjadi '***-**-6789'.

Redaksi

Sepenuhnya menghapus PII yang terdeteksi dari teks, tanpa meninggalkan jejak nilai asli.

Hash

Mengubah PII menjadi hash kriptografis dengan panjang tetap, memungkinkan penggantian yang konsisten sambil membuat pembalikan tidak mungkin secara komputasi.

Enkripsi

Mengubah PII menggunakan enkripsi AES-256-GCM dengan kunci yang dipegang pengguna, memungkinkan pembalikan yang sah (de-anonimisasi) saat diperlukan.

Pertanyaan yang Sering Diajukan

Apa perbedaan antara anonimisasi dan pseudonimisasi?

Anonimisasi secara permanen menghapus semua informasi yang mengidentifikasi sehingga re-identifikasi tidak mungkin. Pseudonimisasi mengganti pengidentifikasi dengan yang buatan sambil menyimpan kunci terpisah yang memungkinkan re-identifikasi saat diizinkan. Di bawah GDPR, data yang dipseudonimkan masih dianggap sebagai data pribadi.

Mengapa deteksi PII menggunakan NLP dan pengenal pola?

Model NLP mendeteksi entitas yang bergantung pada konteks seperti nama orang dan lokasi yang tidak memiliki format tetap. Pengenal pola menggunakan ekspresi reguler untuk menangkap pengidentifikasi terstruktur seperti nomor jaminan sosial, nomor kartu kredit, dan nomor telepon. Menggabungkan kedua pendekatan memaksimalkan akurasi deteksi di semua jenis entitas.

Apa itu enkripsi zero-knowledge dan mengapa itu penting?

Enkripsi zero-knowledge berarti hanya Anda yang memegang kunci dekripsi — penyedia layanan tidak dapat membaca data Anda. Ini penting karena bahkan dalam kasus pelanggaran server, data terenkripsi Anda tetap tidak dapat dibaca tanpa kunci Anda, memberikan perlindungan data yang paling kuat.

Bagaimana enkripsi yang dapat dibalik berbeda dari hashing?

Hashing adalah transformasi satu arah — setelah data di-hash, yang asli tidak dapat dipulihkan. Enkripsi yang dapat dibalik (menggunakan AES-256-GCM) memungkinkan pengguna yang berwenang dengan kunci yang benar untuk mendekripsi dan memulihkan data asli, memungkinkan alur kerja di mana de-anonimisasi diperlukan.

Lindungi Data Sensitif Hari Ini

Mulai anonimisasi PII dengan 320+ jenis entitas, 48 bahasa, dan enkripsi zero-knowledge.