PEMANFAATAN BIG DATA: Saat Privasi Sudah Dianggap Tidak Penting

Masyarakat secara sukarela membagikan data pribadi kepada perusahaan pengembang teknologi seperti media sosial.


1
1 point

Kehadiran internet telah mengubah cara kerja dunia menjadi lebih efisien. Saat ini dunia memasuki era industri 4.0 dengan perkembangan zaman yang semakin modern dan perkembangan teknologi yang semakin canggih (Lee et al., 2014). Dalam menghadapi persaingan bisnis di era industri 4.0 dibutuhkan cara strategis untuk mencapainya yakni dengan mengoptimalkan teknologi seperti machine learning (pembelajaran mesin) dan big data.

Mengapa machine learning itu dibutuhkan? 

Machine learning adalah algoritma serta model statistik yang biasa digunakan oleh sistem komputer untuk melakukan tugas tertentu tanpa instruksi yang eksplisit menggunakan data, sistem mesin memungkinkan komputer menemukan wawasan tersembunyi (Samuel, 1959), serta menghasilkan prediksi dimasa yang akan datang (Goldberg & Holland, 1988), dengan bagian dari kecerdasan buatan (artificial intelligence) yang digunakan untuk memecahkan berbagai permasalahan (Roihan et al., 2019). Didukung keberadaan internet, cara kerja sistem di dunia digital berevolusi dengan begitu cepat karena kesederhanaan dalam melakukan proses pembelajaran (Tran, 2009). Meskipun proses pembelajaran tersebut merupakan usaha dalam memperoleh kecerdasan melalui dua tahap yakni dengan latihan (training) dan pengujian (testing) (Huang et al., 2006).

Sedangkan big data, sebagai salah satu komponen penting dalam industri 4.0 yang dapat merekam jejak identitas pada seseorang yang meninggalkan datanya di dunia digital.  Beberapa para ahli memposisikan big data sebagai sesuatu yang tidak dapat dihindarkan di era industri 4.0 (Anderson, 2008; Schönberger & Cukier, 2013). Big data terdiri dari set data yang sangat besar serta dapat dianalisis secara komputasi untuk mengungkapkan tren, pola, dan asosiasi, biasanya diolah untuk mendapatkan informasi tentang individu tertentu dan atau membuat keputusan yang mempengaruhi sesuatu (Corrales et al., 2017; Syafrina & Irwansyah, 2018). Kondisi tersebut bagi sebagian orang dapat menimbulkan kekhawatiran terhadap dunia maya tanpa privasi dan seringkali data dalam jumlah besar disalahgunakan oleh pihak-pihak yang tidak bertanggung jawab misalnya tentang perusahaan yang lebih mengetahui tentang diri seseorang, dan tentang pemerintah yang mengawasi orang-orang yang dianggap menjadi sebuah ancaman bagi kedudukan atau kekuasaan mereka (Eagle & Greene, 2014).

Manfaat keberadaan Machine learning dan Big Data

1. Mengoptimasi Konten yang Ditampilkan Periklanan Digital

Google Adword merupakan salah satu contoh media periklanan digital di dunia. Adword digunakan untuk menampilkan iklan pada situs web yang menjadi publisher di Google Adsense. Iklan yang akan ditampilkan dapat berubah-ubah sesuai dengan pendekatan hasil pencarian pengguna google. Cara kerja Google Adword adalah dengan mengumpulkan data situs berdasarkan topik, kemudian menampilkan iklan-iklan yang relevan dengan topik tersebut. Google Adword juga menggunakan cookies, yang berfungsi sebagai referensi aktivitas pengunjung suatu website dan akan dikaitkan dengan aktivitas pengguna terhadap kunjungan ke beberapa situs sebelumnya. Adword melakukan akumulasi terhadap 2 faktor tersebut, sehingga dapat ditampilkan iklan yang sesuai dengan pengunjung website.

Description: https://lh6.googleusercontent.com/TFwdhNIdfEe5G0qjsa1ifA5qMlLbKIOlYbGi8VqFiyskMIhUH-Oo86wpChmxB7-RsxJYobugrUX7ZSD0vh4QWoCpUb2O6-CYoepYn8vHl1-YJnZX9oTTUkMJp3ZaJgZJOt7a8t9A

Gambar 1. Cara kerja Google Adword (Advernesia)

Gambar 1 merupakan penerapan machine learning pada industri periklanan Google yang menunjukkan cara kerjanya sebagai berikut:

  • Machine learning akan memindai isi yang terdapat pada halaman website yang dikunjungi.
  • Lalu, machine learning akan menghilangkan iklan-iklan yang serupa sehingga tidak menampilkan iklan yang berulang. 
  • Kemudian, iklan yang sudah divalidasi sesuai dengan website yang dikunjungi akan ditempatkan pada kolom yang optimal sehingga mudah untuk terlihat.

2. Meningkatkan Pengalaman Pengguna Media Sosial

Peningakan pengalaman pengguna media sosial seperti Facebook dan Twitter  tak lepas dari pemanfaatan machine learning, hal tersebut semata-mata untuk memanjakan penggunanya sehingga betah untuk terus terhubung dengan layar gadget. Hal ini terjadi karena peningkatan pengalaman pengguna merupakan bagian dari proses machine learning untuk terus mempelajari bagaimana pengguna berinteraksi menggunakan media sosial. Berikut merupakan beberapa cara machine learning untuk meningkatkan user experience.

·         Orang yang Mungkin Anda kenal

Facebook mengumpulkan informasi pengguna, baik dari informasi umum seperti tempat tinggal, alamat sekolah, alamat kerja, dan kesukaan hingga log aktivitas seperti data percakapan, posting, dan profil yang sering dilihat (stalking). Sehingga bisa dilakukan prediksi teman yang mungkin sama di dunia nyata.

·         Pengenalan Wajah

Facebook dapat mengetahui bahwa suatu gambar yang diunggah memuat wajah orang-orang. Sehingga pengguna dapat memberikan tag wajah pada area wajah di gambar. Seiring berjalannya waktu dengan banyaknya foto yang diunggah, facebook akan mengenali wajah-wajah penggunanya. Ini memungkinkan facebook melakukan tag secara otomatis wajah orang-orang pada gambar baru yang diunggah.

·         Pos pada Beranda

Facebook akan mengumpulkan aktivitas tiap penggunanya, orang yang sering diajak berkomunikasi, posting yang sering disukai, hingga grup yang sering dilihat. Hal ini digunakan untuk menampilkan prioritas postingan yang ditampilkan pada beranda akun penggunanya. Sehingga peluang terjadinya interaksi terhadap pos yang tampil semakin tinggi.

3. Mendukung Kinerja Sektor Pemerintahan, khususnya Komunikasi dan Informatika

Direktorat PPI pada Ditjen IKP telah bekerjasama dengan PT. Delapan Sebelas Indonesia pada tahun 2015 hingga 2016, dan menghasilkan aplikasi pengelolaan Monitoring Media dengan Big Data yang disebut dengan Pamedi (Paques Media Intelligence).

Description: https://lh3.googleusercontent.com/DSpQU38nOZpzbByl8UfgptAObEyZp_lTjW1uvTtZNBPp-gpKE0OR1apehv9IvUdctP1fxWpV8HAjpkzuqvJwzs55P5WmB9_blTQwd5_55vyOT5XmolF-bBKdIJUssyHwO5bo2Q4T

Gambar 2. Tampilan Dashboard Pamedi

Pamedi (Paques Media Intelligence)

Pamedi sebagai alat yang digunakan untuk monitoring media di Direktorat PPI, sudah mulai diterapkan pada tahun 2015. Kemampuan Pamedi ini terbagi menjadi tiga (Ashari, 2015)

  • Media Monitoring: suatu monitoring topik atau isu yang ada pada media sosial maupun media berita secara sistematis, yang memungkinkan pengguna untuk mengakses secara real-time informasi dan alat pengukuran pada aplikasi sehingga memungkinkan pengguna untuk membuat keputusan yang lebih baik dan merespon suatu situasi yang penting.
  • Media Measurements & Analysis: memungkinkan user untuk memaparkan grafik dengan analisis yang berkualitas berdasarkan hasil yang didapatkan pada aplikasi/ akun pengguna.
  • Expert Analysis & Reporting: Pamedi juga memungkinkan untuk membuat suatu laporan yang dapat diubah sesuai kebutuhan lengkap dengan grafiknya. 

Lalu, Mengapa keberadaan Machine Learning dan Big Data dapat mengganggu privasi manusia ?

Perkembangan teknologi tidak dapat dihindari dan saat ini perusahaan secara tidak langsung mengumpulkan data privasi publik ketika pengguna mengunduh ataupun menggunakan aplikasi pengembang. Pengguna tidak diberikan opsi untuk menolak lembaran persetujuan yang berisi pengguna telah memberikan data privasi kepada perusahaan dan perusahaan memiliki hak untuk menggunakan data tersebut. Oleh karena itu, perusahaan teknologi yang mengintegrasikan sistem operasinya dengan big data memiliki kewajiban untuk menjamin keamanan dan menjaga privasi data penggunanya. Hal ini menjadi kode etik perusahaan yang tidak boleh dilanggar yang pertanggungjawabannya tidak hanya kepada pengguna (konsumennya) tetapi juga hukum.

Namun berdasarkan Laporan Data Risk 2019, masih banyak perusahaan yang menyimpan data tanpa proteksi dan mudah diakses oleh karyawan biasa perusahaan (Sobers, 2020). Hal tersebut menyebabkan data publik dapat dipergunakan secara ilegal untuk kepentingan tertentu. Pada Gambar 3 ditunjukkan lebih dari 800 kasus pelanggaran data di seluruh dunia pada tahun 2018.

Description: https://lh4.googleusercontent.com/xCbxctv-lxlbD4JTgrDhnQNy9cffjOxTpYFXFTTtVa-uogWIT2PxwoRUHsLxiQ6B6bOJY52P3OzLz12q7b5dFDB4PydjhAz0d8DyNfiyEwXCNAL_FmgceE0xeb-zPmgAyuzm1gAe

Gambar 3. Jumlah kasus pelanggaran data (Gilbert, 2018)

Proses pelanggaran data dapat dilakukan oleh pihak internal atau eksternal perusahaan. Menurut Gilbert (2018), data pengguna suatu perusahaan dapat diperoleh melalui pencurian data, karyawan dalam perusahaan, ataupun ketidaksengajaan dan kerusakan sistem. Apabila hal tersebut terjadi maka akan memberikan dampak yang merugikan khususnya untuk privasi pengguna.

1.      Menggiring opini publik untuk kepentingan politik

Keberadaan machine learning dengan berbagai algoritma yang dikembangkan setiap perusahaan, khususnya perusahaan media sosial, memungkinkan pengguna menerima konten sesuai dengan jejak penggunaan media sosial tersebut yang terekam dalam data. Hal tersebut dikembangkan untuk memuaskan penggunaan media sosial. Namun, apabila terdapat peretasan data dapat memungkinkan pengguna menerima konten yang tidak sesuai dengan keinginannya. 

Pada tahun 2015, terbongkar kasus pencurian data milik Facebook oleh Cambridge Analytica yang mana dipergunakan untuk kepentingan politik. Data yang terkumpul dipergunakan untuk alat kampanye dalam penyebaran konten digital. (Gunadha, 2018). Kecanggihan machine learning membuat tim politikus dapat menyesuaikan target audiens berdasarkan data yang efeknya dapat mengubah perspektif terhadap salah satu calon.

2.      Monetisasi data menyingkap perilaku dan sifat individu

Salah satu pelanggaran data dapat terjadi akibat internal perusahaan yang menjual (memonetisasi) data tersebut pada perusahaan lain. Perusahaan tersebut membeli data dengan tujuan ingin mengetahui gaya hidup seseorang melalui rekaman kartu kredit. Contohnya adalah Agensi Asuransi untuk menganalisis antara kebiasaan hidup nasabah dengan tarif asuransi jiwanya. Hal ini untuk mengurangi resiko penanggungan biaya yang tinggi dan tidak sesuai dengan tarif asuransi jiwa nasabah di awal kesepakatan (Kochetkova, 2015).

Health Engine yang merupakan aplikasi pembuat janji bertemu dokter di Australia memberikan data pasiennya sebesar 200 pasien tiap bulan kepada firma Hukum Slater & Gordon yang mencari klien untuk klaim cidera (Maluga, 2018). Selain itu, perusahaan tersebut juga menjual 135.000 data pasiennya kepada pihak asuransi kesehatan (McGrath, 2019). Praktik ini tentunya melanggar kode etik privasi data untuk kepentingan pihak-pihak tertentu dalam mendapatkan keuntungan.

3.      Pembajakan ponsel pengguna

Kebocoran data pribadi seperti nama, alamat, password, sidik jari, nomor kartu kredit memungkinkan terjadi tindak kejahatan seperti pembobolan bank, ancaman, ataupun penghasutan. Ketidaknyamanan dirasakan oleh Denny Siregar dan Ravio Patra ketika aplikasi Whatsappnya diretas dan dipergunakan oleh oknum untuk menyebarkan ujian kebencian dan penghasutan (Gobel, 2020).

     Walaupun sudah ada GDPR (General Data Protection Regulation) dan aturan perlindungan data pribadi oleh tiap negara, kasus pelanggaran data masih tetap terjadi. Hal ini tentunya akan merugikan perusahaan bersangkutan karena harus membayar denda. Bahkan ada yang menyangkal tuduhan penyalahgunaan data seperti Health Engine akibat sudah adanya persetujuan penggunaan data oleh pengguna ketika pengguna melakukan pendaftaran penggunaan aplikasi (Maluga, 2018).  Hal ini tentu menjadi evaluasi bagi perusahaan dalam memahami esensi privacy policy dan penggunaan click wrap untuk mendapatkan persetujuan pengguna.

Solusi yang ditawarkan

Masalah privasi dan hukum merupakan tantangan tersendiri dalam penggunaan big data. Meskipun teknologi big data sangat berguna dalam mempermudah kehidupan, namun di sisi lain teknologi ini juga mengancam privasi. Meskipun identitas individu merupakan sesuatu yang harus dijaga dan dilindungi, namun hal ini sulit untuk dijamin ketika berhadapan dengan big data. Hal ini disebabkan karena belum ada undang-undang dan peraturan yang mengatur hal tersebut secara jelas. Sehingga untuk memutuskan apakah dan bagaimana menggunakan big data hanya berpatokan pada standar etika. Untuk menjamin privasi, secara umum terdapat hal yang dapat dilakukan yaitu: manajemen identitas, otentikasi dan otorisasi (Meutia 2015).

  • Manajemen identitas menyediakan fungsi pemetaan identitas utama ke identitas kedua, bagi pihak yang membutuhkan layanan dan memiliki kredensial yang benar. Otentikasi berfungsi untuk mengikat sebuah objek dengan identitasnya dan untuk menjamin peran dari objek tersebut. 
  • Manajemen otorisasi merupakan proses pemberian akses terhadap informasi maupun ke sumber daya bagi sebuah objek sesuai dengan aturan akses dan jenis aksi tertentu. Di samping itu, pengguna juga harus memiliki kontrol penuh terhadap aturan akses yang berhubungan dengan data personalnya.

Secara khusus, pemrosesan yang mengancam identitas, kesetaraan, keamanan, integritas data, dan kepercayaan harus diatur dan bila perlu dilarang. Perlu dikembangkan aturan-aturan etis dalam penggunaan big data yang kemudian diterapkan dan dipatuhi oleh para pemimpin lintas fungsional. Dengan ancaman privasi dalam big data menyamakan visi tentang etika big data, regulasi tersebut dapat membangun kepercayaan dan secara bertanggung jawab memanfaatkan kekuatan penuh dalam proses big data.

Pemerintah juga perlu terlibat secara langsung dalam menetapkan aturan, regulasi maupun batasan-batasan mengenai tanggung jawab, akuntabilitas, kebijakan dan prosedur dalam pemanfaatan analisis big data. Pemerintah juga sebaiknya turut terlibat secara langsung dalam memonitor pemanfaatan big data dalam masyarakat, melakukan perbaikan maupun perubahan atas aturan berkenaan dengan perkembangan teknologi yang terus menerus berubah, khususnya teknologi big data. Yang tak kalah penting adalah, adanya penegakan hukum maupun sanksi atas pelanggaran, khususnya pelanggaran etika, atas kesepakatan dan peraturan yang telah disetujui bersama. Sehingga semua pihak dapat merasakan manfaat yang lebih baik dan lebih besar dalam pemanfaatan teknologi, khususnya big data, dan tetap dalam koridor penegakan hukum yang berlandaskan etika.

Selain solusi dari sisi data policy dan kebijakan pemerintah, terdapat solusi teknis yang mungkin untuk diterapkan, yaitu homomorphic encryption. Homomorphic encryption merupakan bentuk penguncian data yang memungkinkan komputasi pada data yang terenkripsi. Hal ini memungkinkan data pengguna tetap dapat digunakan untuk operasional machine learning namun tetap menjaga privasi dari data pengguna. Sistem penguncian data ini belum digunakan karena adanya penurunan performa pada data yang dioperasikan dalam keadaan terenkripsi, sehingga proses training pada algoritma machine learning pun menjadi lebih lambat.

Maka untuk mengatasi hal tersebut, terdapat algoritma yang dapat menjadi alternatif, yaitu partially homomorphic encryption dimana data pengguna tetap dapat dioperasikan namun tidak bisa dipakai untuk membantu pengembangan algoritma machine learning tersebut. Sehingga pengguna yang peduli dengan privasinya dapat memilih untuk mengunci datanya dan tidak ikut mengembangkan algoritma machine learning, namun tetap bisa menikmati fitur/output dari machine learning tersebut. Bagi pengguna yang setuju untuk memberikan datanya demi pengembangan algoritma machine learning dapat membuat datanya tidak terkunci.

Partially homomorphic encryption dapat menjadi solusi teknis alternatif, sampai ada fully homomorphic encryption dengan performa yang baik di masa mendatang. Dengan diterapkannya fully homomorphic encryption, seluruh data pengguna dapat terjaga privasinya dan algoritma machine learning tetapdapat mempelajari data tersebut serta pengguna dapat menikmati output dari algoritma machine learning tersebut.

REFERENSI

Advernesia. 10 Manfaat dan Contoh Penerapan Machine Learning. Retrieved  September 16, 2020, from Advernesia:  https://www.advernesia.com/blog/data-science/10-manfaat-dan-contoh-penerapan-machine-learning/

Anderson, T. (2008). The Theory and Practice of Online Learning. Second. Edition. AU Press Canada: Athabasca University.

Ashari, P. D. (2015). Big Data Industry and Academic Point of View. Konferensi Big Data Indonesia. Jakarta: PT. Delapan Sebelas Indonesia.

Corrales, M., Fenwick, M., & Forgo, N. (2017). New Technology, Big Data, and the Law. Singapore: Springer.

Eagle, N., & Greene, K. L. (2014). Reality Mining: Using Big Data to Engineer a Better World. London: MIT Press.

Gilbert, P. (2018, Oktober). Social Media Becomes Biggest Data Breach Threat. Retrieved 16 September 2020, from ITWeb: https://www.itweb.co.za/content/G98YdqLxZZNqX2PD

Gobel, T. (2020, Juli). Kuasa Hukum Minta Peretasan WA Ravio Patra Diproses seperti Denny Siregar. Retrieved September 2020, from Cyberthreat.id: cyberthreat.id/read/7574/Kuasa-Hukum-Minta-Peretasan-WA-Ravio-Patra-Diproses-seperti-Denny-Siregar

Goldberg, D. E., & Holland, J. H. (1988). Genetic algorithms and machine learning. Machine learning, 3(2), 95-99.

Gunadha, R. (2018, Maret). 50 Juta Data Pengguna Facebook Dicuri untuk Kepentingan Politik. Retrieved 16 September 2020, from Suara.com: https://www.suara.com/tekno/2018/03/21/142747/50-juta-data-pengguna-facebook-dicuri-untuk-kepentingan-politik?page=all

Huang, G.-B., Zhu, Q.-Y., & Siew, C.-K. (2006). Extreme learning machine: theory and applications. Neurocomputing, 70(1–3), 489–501.

Kochetkova, K. (2015, Agustus). The scary side of big data. Retrieved 16 September 2020, from Kaspersky Daily: https://www.kaspersky.com/blog/scary-big-data/9626/

Lee, J., Kao, H. A., & Yang, S. (2014). Service Innovation and Smart Analytics for Industry 4.0 and Big Data Environment. Science Direct, 3-8.

Maluga, P. (2018, Juni). HealthEngine May be In Breach of Privacy Law in Sharing Patient Data. Retrieved 16 September 2020, from The Conversation: https://theconversation.com/healthengine-may-be-in-breach-of-privacy-law-in-sharing-patient-data-98942

Mayer-Schönberger, V., & Cukier, K. (2013). Big Data: Revolution That Will Transform How We Live, Work and Think. London: John Murray (Publishers). 

McGrath, P. (2019, Agustus). HealthEngine, medical booking app, facing multi-million-dollar fines for selling patient data. Retrieved 16 September 2020, from ABC News: https://www.abc.net.au/news/2019-08-08/healthengine-facing-massive-fine-after-abc-investigation/11394564

Roihan, A., Sunarya, P. A., & Rafika, A. S. (2019). Pemanfaatan Machine Learning dalam Berbagai Bidang: Review Paper. Indonesian Journal on Computer and Information Technology, 5(1), 75-82. 

Samuel, A. L. (1959). Some Studies in Machine Learning Using the Game of Checkers. IBM Journal of Research and Development, 3(3), doi: 10.1147/rd.33.0210.

Sobers, R. (2020, Maret). 107 Must-Know Data Breach Statistics for 2020. Retrieved 16 September 2020, from Varonis: https://www.varonis.com/blog/data-breach-statistics/

Syafrina, A. E., & Irwansyah. (2018). Ancaman Privasi dalam Big Data. Jurnal Penelitian Komunikasi dan Opini Publik, 22(2).

Tran, D. A. (2009). Chapter in Book Machine Learning Based Localization. Guoqiang mao and Baris Fidan: IGI Global.

KELOMPOK UNITED STATE OF AWESOME

ARSY ELIA PERTIWI

DESTI PATONAH

DONAL ANRY JAYA SINURAT

FAISAL MALIK WIDYA PRASETYA

RIDHA JULIANSYAH


Like it? Share with your friends!

1
1 point

What's Your Reaction?

Confused Confused
0
Confused
Sad Sad
0
Sad
Fun Fun
0
Fun
Genius Genius
0
Genius
Love Love
0
Love
OMG OMG
0
OMG
Win Win
0
Win
Arsy Elia

0 Comments

Choose A Format
Personality quiz
Series of questions that intends to reveal something about the personality
Trivia quiz
Series of questions with right and wrong answers that intends to check knowledge
Poll
Voting to make decisions or determine opinions
Story
Formatted Text with Embeds and Visuals
List
The Classic Internet Listicles
Countdown
The Classic Internet Countdowns
Open List
Submit your own item and vote up for the best submission
Ranked List
Upvote or downvote to decide the best list item
Meme
Upload your own images to make custom memes
Video
Youtube, Vimeo or Vine Embeds
Audio
Soundcloud or Mixcloud Embeds
Image
Photo or GIF
Gif
GIF format