Kamus PII & Privasi Data

Definisi yang jelas tentang istilah kunci privasi, kepatuhan, dan perlindungan data yang digunakan di seluruh industri.

Istilah Privasi & Kepatuhan

Informasi yang Dapat Diidentifikasi Secara Pribadi (PII)

Data apa pun yang dapat mengidentifikasi individu tertentu, seperti nama, alamat email, nomor jaminan sosial, atau nomor telepon.

Anonimisasi

Proses yang tidak dapat dibalik dari mengubah data sehingga individu tidak dapat diidentifikasi, baik secara langsung maupun tidak langsung.

Pseudonimisasi

Mengganti data yang dapat diidentifikasi dengan pengidentifikasi buatan (pseudonim) sehingga re-identifikasi memerlukan kunci yang disimpan secara terpisah.

De-identifikasi

Menghapus atau menyembunyikan pengidentifikasi pribadi dari data sehingga tidak dapat lagi dihubungkan dengan individu tertentu tanpa informasi tambahan.

Subjek Data

Seseorang yang teridentifikasi atau dapat diidentifikasi yang data pribadinya diproses oleh pengendali atau pemroses.

Pengendali Data

Entitas yang menentukan tujuan dan cara pemrosesan data pribadi.

Pemroses Data

Entitas yang memproses data pribadi atas nama pengendali data, mengikuti instruksi pengendali.

Persetujuan

Indikasi yang diberikan secara bebas, spesifik, terinformasi, dan tidak ambigu dari kesepakatan subjek data untuk pemrosesan data pribadi mereka.

Dasar Hukum

Dasar hukum di mana pemrosesan data pribadi diizinkan, seperti persetujuan, kebutuhan kontrak, kewajiban hukum, atau kepentingan yang sah.

Minimisasi Data

Prinsip bahwa data pribadi yang dikumpulkan harus memadai, relevan, dan terbatas pada apa yang diperlukan untuk tujuan yang dimaksud.

Hak untuk Dihapus

Hak subjek data untuk memiliki data pribadi mereka dihapus ketika tidak lagi diperlukan, juga dikenal sebagai 'hak untuk dilupakan' di bawah GDPR.

Portabilitas Data

Hak subjek data untuk menerima data pribadi mereka dalam format yang terstruktur dan umum digunakan serta untuk mentransfernya ke pengendali lain.

Petugas Perlindungan Data (DPO)

Individu yang ditunjuk bertanggung jawab untuk mengawasi strategi perlindungan data organisasi dan memastikan kepatuhan terhadap peraturan privasi.

Penilaian Dampak Perlindungan Data (DPIA)

Proses untuk mengidentifikasi dan meminimalkan risiko perlindungan data dari suatu proyek, yang diperlukan di bawah GDPR untuk aktivitas pemrosesan berisiko tinggi.

Pelanggaran Data

Insiden keamanan di mana data pribadi diakses, diungkapkan, diubah, atau dihancurkan tanpa izin.

Bayangan AI

Penggunaan alat AI tanpa izin (ChatGPT, Copilot, Gemini) oleh karyawan tanpa persetujuan TI. Shadow AI adalah penyebab utama kebocoran data PII, karena pengguna menempelkan data bisnis sensitif — catatan pelanggan, informasi pasien, data keuangan — langsung ke perintah AI.

Minimalkan Data

Prinsip GDPR (Pasal 5(1)(c)) yang mewajibkan organisasi untuk mengumpulkan dan memproses hanya data pribadi minimum yang diperlukan untuk tujuan tertentu. Dalam sistem AI, minimalisasi data berarti menganonimkan atau menghapus PII sebelum data memasuki saluran AI, sehingga mengurangi risiko kepatuhan dan pelanggaran yang muncul.

Kerangka Regulasi

GDPR (Regulasi Perlindungan Data Umum)

Regulasi UE yang mengatur pemrosesan data pribadi individu di dalam Kawasan Ekonomi Eropa, berlaku sejak Mei 2018.

CCPA (Undang-Undang Privasi Konsumen California)

Undang-undang negara bagian California yang memberikan hak kepada konsumen atas informasi pribadi mereka yang dikumpulkan oleh bisnis, berlaku sejak Januari 2020.

HIPAA (Undang-Undang Portabilitas dan Akuntabilitas Asuransi Kesehatan)

Undang-undang federal AS yang menetapkan standar untuk melindungi informasi kesehatan pasien yang sensitif dari pengungkapan tanpa persetujuan.

ISO 27001

Standar internasional untuk sistem manajemen keamanan informasi (ISMS), yang menetapkan persyaratan untuk mendirikan, menerapkan, dan terus meningkatkan kontrol keamanan.

SOC 2 (Kontrol Sistem dan Organisasi 2)

Kerangka audit untuk organisasi layanan yang mengevaluasi kontrol terkait keamanan, ketersediaan, integritas pemrosesan, kerahasiaan, dan privasi.

PROT010AKHIR

Peraturan Uni Eropa tentang kecerdasan buatan (berlaku mulai Agustus 2026). Sistem AI yang berisiko tinggi harus menerapkan langkah-langkah tata kelola data termasuk minimalisasi data pribadi, dokumentasi, dan DPIA. Organisasi yang menggunakan AI untuk pengambilan keputusan individu harus memastikan data pelatihan dianonimkan atau disamarkan.

PROT008AKHIR

Standar internasional untuk Sistem Manajemen AI (AIMS), diterbitkan pada tahun 2023. Memberikan kerangka kerja untuk pengembangan dan penerapan AI yang bertanggung jawab, termasuk kualitas data, kontrol bias, dan perlindungan privasi. Sering dipasangkan dengan ISO 27001 untuk organisasi yang mengoperasikan sistem AI dengan data pribadi.

India DPDP Act

Undang-Undang Perlindungan Data Pribadi Digital India (2023), diberlakukan mulai tahun 2025. Memerlukan persetujuan eksplisit untuk memproses data pribadi penduduk India, lokalisasi data untuk data sensitif, dan pemberitahuan pelanggaran dalam waktu 72 jam. Berlaku untuk organisasi global yang memproses data warga negara India.

Istilah Teknis

Pengenalan Entitas Bernama (NER)

Teknik NLP yang mengidentifikasi dan mengklasifikasikan entitas bernama dalam teks ke dalam kategori yang telah ditentukan seperti nama orang, lokasi, dan organisasi.

Pemrosesan Bahasa Alami (NLP)

Sebuah cabang kecerdasan buatan yang memungkinkan komputer untuk memahami, menginterpretasikan, dan menghasilkan bahasa manusia.

Pengenal Pola

Detektor berbasis aturan yang menggunakan ekspresi reguler dan petunjuk konteks untuk mengidentifikasi pola data tertentu, seperti nomor kartu kredit atau nomor jaminan sosial.

Skor Kepercayaan

Nilai numerik antara 0 dan 1 yang menunjukkan seberapa yakin mesin deteksi bahwa sepotong teks cocok dengan jenis entitas tertentu.

Ekspresi Reguler (Regex)

Urutan karakter yang mendefinisikan pola pencarian, biasanya digunakan untuk memvalidasi dan mendeteksi format data terstruktur seperti nomor telepon atau alamat email.

AES-256-GCM

Algoritma enkripsi terautentikasi yang menggunakan kunci 256-bit dengan Mode Galois/Counter, memberikan baik kerahasiaan maupun verifikasi integritas data yang dienkripsi.

Enkripsi Zero-Knowledge

Arsitektur enkripsi di mana hanya pengguna yang memegang kunci dekripsi, yang berarti bahkan penyedia layanan tidak dapat mengakses data plaintext.

Tokenisasi

Mengganti data sensitif dengan token pengganti yang tidak sensitif yang dapat dipetakan kembali ke data asli melalui pencarian yang aman.

Masking Data

Menyembunyikan data tertentu dalam dataset sehingga informasi sensitif tersembunyi sementara data tetap dapat digunakan untuk pengujian atau analisis.

Redaksi

Penghapusan permanen informasi sensitif dari dokumen atau dataset, menggantinya dengan penanda seperti [REDACTED].

Data Sintetis

Data yang dihasilkan AI yang secara statistik meniru data nyata tanpa memuat catatan sebenarnya. Dibandingkan dengan anonimisasi: data yang dianonimkan mempertahankan akurasi analitis yang lebih tinggi untuk ML hilir; data sintetis menghilangkan risiko identifikasi ulang tetapi menimbulkan penyimpangan statistik. Anonimisasi yang dapat dibalik lebih disukai ketika catatan asli mungkin diperlukan untuk audit kepatuhan.

Injeksi Cepat LLM

Teknik serangan di mana masukan berbahaya memanipulasi model bahasa besar untuk mengabaikan instruksi atau membocorkan informasi sensitif. Dalam konteks perlindungan PII, injeksi cepat dapat menyebabkan model AI mengungkapkan pola data atau informasi pengguna yang dianonimkan. Input yang dianonimkan terlebih dahulu sebelum mencapai LLM akan mengurangi permukaan serangan.

Privasi berdasarkan Desain

Seni GDPR. Prinsip 25 mengharuskan perlindungan data untuk dibangun ke dalam sistem dari awal dan bukan hanya sekedar tambahan saja. Untuk sistem AI, privacy-by-design berarti menganonimkan data sebelum memasuki saluran AI, menerapkan enkripsi tanpa pengetahuan, dan meminimalkan retensi data.

Metode Anonimisasi

Ganti

Mengganti PII yang terdeteksi dengan pengganti generik dari jenis entitas yang sama, seperti mengganti 'John Smith' dengan '<PERSON>'.

Masker

Sebagian menyembunyikan PII dengan mengganti karakter dengan simbol pemaskingan, misalnya mengubah '123-45-6789' menjadi '***-**-6789'.

Redaksi

Sepenuhnya menghapus PII yang terdeteksi dari teks, tanpa meninggalkan jejak nilai asli.

Hash

Mengubah PII menjadi hash kriptografis dengan panjang tetap, memungkinkan penggantian yang konsisten sambil membuat pembalikan tidak mungkin secara komputasi.

Enkripsi

Mengubah PII menggunakan enkripsi AES-256-GCM dengan kunci yang dipegang pengguna, memungkinkan pembalikan yang sah (de-anonimisasi) saat diperlukan.

Pertanyaan yang Sering Diajukan

Apa perbedaan antara anonimisasi dan pseudonimisasi?

Anonimisasi secara permanen menghapus semua informasi yang mengidentifikasi sehingga re-identifikasi tidak mungkin. Pseudonimisasi mengganti pengidentifikasi dengan yang buatan sambil menyimpan kunci terpisah yang memungkinkan re-identifikasi saat diizinkan. Di bawah GDPR, data yang dipseudonimkan masih dianggap sebagai data pribadi.

Mengapa deteksi PII menggunakan NLP dan pengenal pola?

Model NLP mendeteksi entitas yang bergantung pada konteks seperti nama orang dan lokasi yang tidak memiliki format tetap. Pengenal pola menggunakan ekspresi reguler untuk menangkap pengidentifikasi terstruktur seperti nomor jaminan sosial, nomor kartu kredit, dan nomor telepon. Menggabungkan kedua pendekatan memaksimalkan akurasi deteksi di semua jenis entitas.

Apa itu enkripsi zero-knowledge dan mengapa itu penting?

Enkripsi zero-knowledge berarti hanya Anda yang memegang kunci dekripsi — penyedia layanan tidak dapat membaca data Anda. Ini penting karena bahkan dalam kasus pelanggaran server, data terenkripsi Anda tetap tidak dapat dibaca tanpa kunci Anda, memberikan perlindungan data yang paling kuat.

Bagaimana enkripsi yang dapat dibalik berbeda dari hashing?

Hashing adalah transformasi satu arah — setelah data di-hash, yang asli tidak dapat dipulihkan. Enkripsi yang dapat dibalik (menggunakan AES-256-GCM) memungkinkan pengguna yang berwenang dengan kunci yang benar untuk mendekripsi dan memulihkan data asli, memungkinkan alur kerja di mana de-anonimisasi diperlukan.

Lindungi Data Sensitif Hari Ini

Mulai anonimisasi PII dengan 317 jenis entitas, 48 bahasa, dan enkripsi zero-knowledge.