Pebandingan Metode Decision Tree dan XGBoost untuk Klasifikasi Sentimen Vaksin Covid-19 di Twitter
DOI:
https://doi.org/10.25077/TEKNOSI.v8i3.2022.107-114Kata Kunci:
Decision tree, XGBoost, Vaksin Covid-19, Klasifikasi sentimenAbstrak
Pemerintah Indonesia melaksanakan vaksinasi dalam upaya pencegahan virus COVID-19. Namun upaya tersebut memicu pro dan kontra dalam masyarakat. Pro dan kontra tersebut dapat dikatakan sebagai sentimen. Sentimen dapat diungkapkan di berbagai media, salah satunya adalah media sosial. Teknik yang digunakan untuk mendeteksi sentimen pada media sosial salah satunya adalah klasifikasi teks dengan machine learning. Penelitian ini akan membandingkan Decision tree dan XGBoost untuk mengklasifikasikan sentimen di twitter. Data diperoleh dengan cara crawling menggunakan pemograman pyton dan Twitter API. Data diberi label dengan teknik crowdsourcing dan majority voting. Data yang digunakan setelah diseimbangkan adalah 6000 data latih, 778 data validasi dan 400 data uji. Hasil pengujian Decision tree dan XGBoost mendapatkan hasil terbaik pada model XGBoost dengan nilai akurasi sebesar 66% dan f1-score sebesar 57%. Hasil ini juga merupakan yang terbaik dibanding metode yang digunakan pada penelitian sebelumnya dengan dataset yang sama.Referensi
[1] N. R. Yunus dan A. Rezki, “Kebijakan Pemberlakuan Lock Down Sebagai Antisipasi Penyebaran Corona Virus Covid-19,†SALAM: Jurnal Sosial dan Budaya Syar-i, vol. 7, no. 3, hlm. 227–238, 2020, doi: 10.15408/sjsbs.v7i3.15083. [2] A. L. Fairuz, R. D. Ramadhani, dan N. A. Tanjung, “Analisis Sentimen Masyarakat Terhadap COVID-19 Pada Media Sosial,†Jurnal DINDA, vol. 1, no. 1, hlm. 10–12, 2021, [Daring]. Available: http://journal.ittelkom-pwt.ac.id/index.php/dinda/article/view/180 [3] M. A. Fauzi dan S. Adinugroho, “Analisis Sentimen Pariwisata di Kota Malang Menggunakan Metode Naive Bayes dan Seleksi Fitur Query Expansion Ranking Image Processing View project Smart Wheelchair View project,†Researchgate.Net, vol. 2, no. 8, hlm. 2766–2770, 2018. [4] P. Yohana, “Analisis Sentimen Vaksin Covid19 Menggunakan Naive Bayes,†Universitas Islam Negeri Sultan Syarif Kasim Riau, Pekanbaru, 2022. [5] M. Rizky, “Analisis Sentimen Masyarakat Terhadap Vaksin Covid-19 Menggunakan Metode Support Vector Machine Pada Media Sosial Twitter,†Universitas Islam Negeri Sultan Syarif Kasim Riau, Pekanbaru, 2022. [6] M. Ihsan, B. S. Negara, dan S. Agustian, “Metode LSTM (Long short term memory) untuk Klasifikasi Sentimen Vaksin Covid-19 pada Twitter,†Digital Zone: Jurnal Teknologi Informasi Dan Komunikasi, vol. 13(1), hlm. 1–13, 2022. [7] F. Ihsan, “Implementasi Algoritma Decision Tree untuk Mendeteksi Multi-Label Hate Speech dan Abusive Language pada Twitter Bahasa Indonesia,†Universitas Islam Negeri Sultan Syarif Kasim Riau, 2021. [8] A. Amri, “Implementasi Algoritma Random Forest Untuk Mendeteksi Hate Speech Dan Abusive Language Pada Twitter Bahasa Indonesia,†2020. [9] A. Fadilah, “Penerapan Algoritma K-Nearest Neighbor untuk Mendeteksi Ujaran Kebencian dan Bahasa Kasar pada Twitter Bahasa Indonesia,†2021. [10] M. Syukron, R. Santoso, dan T. Widiharih, “Perbandingan Metode Smote Random Forest Dan Smote Xgboost Untuk Klasifikasi Tingkat Penyakit Hepatitis C Pada Imbalance Class Data,†Jurnal Gaussian, vol. 9, no. 3, hlm. 227–236, 2020, doi: 10.14710/j.gauss.v9i3.28915. [11] M. R. Givari, M. R. Sulaeman, dan Y. Umaidah, “Perbandingan Algoritma SVM, Random Forest Dan XGBoost Untuk Penentuan Persetujuan Pengajuan Kredit,†Nuansa Informatika, vol. 16, no. 1, hlm. 141–149, 2022, doi: 10.25134/nuansa.v16i1.5406. [12] R. Wardoyo, A. Musdholifah, G. Angga Pradipta, dan I. N. Hariyasa Sanjaya, “Weighted Majority Voting by Statistical Performance Analysis on Ensemble Multiclassifier,†dalam 2020 Fifth International Conference on Informatics and Computing (ICIC), Nov 2020, hlm. 1–8. doi: 10.1109/ICIC50835.2020.9288552. [13] S. Khomsah dan A. S. Aribowo, “Model Text-Preprocessing Komentar Youtube Dalam Bahasa Indonesia,†JURNAL RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 1, no. 10, hlm. 648–654, 2021. [14] U. Rofiqoh, R. S. Perdana, dan M. A. Fauzi, “Analisis Sentimen Tingkat Kepuasan Pengguna Penyedia Layanan Telekomunikasi Seluler Indonesia Pada Twitter Dengan Metode Support Vector Machine dan Lexion Based Feature,†Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer (J-PTIIK) Universitas Brawijaya, vol. 1, no. 12, hlm. 1725–1732, 2017, [Daring]. Available: http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/628 [15] I. Sutoyo, “Implementasi Algoritma Decision Tree Untuk Klasifikasi Data Peserta Didik,†Jurnal Pilar Nusa Mandiri, vol. 14, no. 2, hlm. 217, 2018, doi: 10.33480/pilar.v14i2.926. [16] K. Kusrini, S. Hartati, R. Wardoyo, dan A. Harjoko, “Klasifikasi Citra Dengan Pohon Keputusan,†JUTI: Jurnal Ilmiah Teknologi Informasi, vol. 7, no. 2, hlm. 55, 2008, doi: 10.12962/j24068535.v7i2.a173. [17] Z. Salam Patrous, “Evaluating XGBoost for User Classification by using Behavioral Features Extracted from Smartphone Sensors,†hlm. 67, 2018, [Daring]. Available: https://www.diva-portal.org/smash/record.jsf?pid=diva2%3A1240595&dswid=-6444 [18] I. Muslim dan K. Karo, “Implementasi Metode XGBoost dan Feature Importance untuk Klasifikasi pada Kebakaran Hutan dan Lahan,†Journal of Software Engineering, Information and Communication Technology, vol. 1, no. 1, hlm. 10–16, 2020. [19] D. I. Baihaqi, A. N. Handayani, dan U. Pujianto, “Perbandingan Metode Naïve Bayes Dan C4.5 Untuk Memprediksi Mortalitas Pada Peternakan Ayam Broiler,†Simetris: Jurnal Teknik Mesin, Elektro dan Ilmu Komputer, vol. 10, no. 1, hlm. 383–390, Apr 2019, doi: 10.24176/simet.v10i1.2846.
Unduhan
Telah diserahkan
Diterima
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak cipta untuk artikel ini ditransfer ke Jurnal Nasional Teknologi dan Sistem Informasi (TEKNOSI) jika dan ketika artikel diterima untuk publikasi. Yang bertanda tangan di bawah ini dengan ini mentransfer setiap dan semua hak di dalam dan ke kertas termasuk tanpa batasan semua hak cipta untuk TEKNOSI. Yang bertanda tangan di bawah ini dengan ini menyatakan dan menjamin bahwa makalah tersebut asli dan bahwa ia adalah pembuat makalah, kecuali untuk bahan yang secara jelas diidentifikasi sebagai sumber aslinya, dengan pemberitahuan izin dari pemilik hak cipta jika diperlukan. Yang bertanda tangan di bawah ini menyatakan bahwa ia memiliki kekuatan dan wewenang untuk membuat dan melaksanakan penugasan ini.
Kami menyatakan bahwa:
- Makalah ini belum diterbitkan dalam bentuk yang sama di tempat lain.
- Makalah ini tidak akan dikirimkan di tempat lain untuk publikasi sebelum penerimaan/penolakan oleh Jurnal ini
- Izin hak cipta diperoleh untuk materi yang diterbitkan di tempat lain dan yang memerlukan izin ini untuk reproduksi.
Selanjutnya, Saya/kami dengan ini mentransfer hak publikasi yang tidak terbatas dari makalah yang disebutkan di atas secara keseluruhan kepada TEKNOSI. Transfer hak cipta mencakup hak untuk mereproduksi dan mendistribusikan artikel, termasuk cetak ulang, terjemahan, reproduksi foto, mikroform, bentuk elektronik (offline, online) atau reproduksi lain yang serupa.
Penulis yang sesuai menandatangani dan menerima tanggung jawab untuk merilis materi ini atas nama setiap dan semua penulis bersama. Perjanjian ini harus ditandatangani oleh setidaknya salah satu penulis yang telah memperoleh persetujuan dari rekan penulis jika berlaku. Setelah pengajuan perjanjian ini ditandatangani oleh penulis yang sesuai, perubahan kepengarangan atau dalam urutan penulis yang tercantum tidak akan diterima.
Hak / Syarat dan Ketentuan yang dipertahankan :
- Penulis memiliki semua hak kepemilikan dalam setiap proses, prosedur, atau artikel manufaktur yang dijelaskan dalam Karya ini.
- Penulis dapat mereproduksi atau mengotorisasi orang lain untuk mereproduksi karya ini atau karya turunannya untuk penggunaan pribadi penulis atau untuk penggunaan perusahaan, dengan ketentuan bahwa sumber dan menyatakan hak cipta dimiliki TEKNOSI, salinan tidak digunakan dengan cara apa pun yang menyiratkan pengesahan TEKNOSI atas suatu produk atau layanan dari pihak mana pun, dan salinannya sendiri tidak ditawarkan untuk dijual.
- Meskipun penulis diizinkan untuk menggunakan kembali semua atau sebagian dari karya ini dalam karya lain, ini tidak termasuk mengabulkan permintaan pihak ketiga untuk mencetak ulang, menerbitkan ulang, atau jenis penggunaan ulang lainnya.