Implementasi Random Forest Menggunakan SMOTE untuk Analisis Sentimen Ulasan Aplikasi Sister for Students UNEJ

Anisa Fitri Anjani(1), Dian Anggraeni(2*), I Made Tirta(3)
(1) Jurusan Matematika Fakultas MIPA, Universitas Jember
(2) Jurusan Matematika Fakultas MIPA, Universitas Jember
(3) Jurusan Matematika Fakultas MIPA, Universitas Jember
(*) Corresponding Author



Abstrak


Pendidikan di era digital sangat memanfaatkan teknologi dan informasi sebagai prasarana  pembelajaran melalui aplikasi milik perguruan tinggi tertenu. Sister for Students (SFS) merupakan aplikasi yang dikembangkan oleh UPT-TIK Universitas Jember yang memiliki peran sangat penting untuk menunjang kegiatan pembelajaran di Universitas Jember, sehingga perlu dilakukan analisis kualitas layanan aplikasi tersebut berdasarkan komentar oleh pengguna menggunakan analisis sentimen. Analisis sentimen merupakan klasifikasi teks yang dilakukan dengan tujuan memperoleh informasi dari pengguna mengenai kualitas layanan SFS. Masalah yang sering terjadi pada proses klasifikasi yaitu adanya data imbalance, salah satunya pada klasifikasi teks. SMOTE dilakukan untuk menangani data imbalance dengan cara membangkitkan data sintetis pada kelas minoritas, hal ini diharapkan agar kinerja klasifikasi lebih baik. Penelitian ini menggunakan metode klasifikasi Random Forest dan SMOTE dengan perbandingan proporsi splitting data  dan  untuk analisis sentimen pada ulasan aplikasi SFS. Data yang digunakan sebanyak 913 data dimana kelas positif sejumlah 363 dan negatif sejumlah 550. Hasil model terbaik yaitu model Random Forest menggunakan SMOTE dengan proporsi 90:10 dengan akurasi testing 98,9%, recall 100%, precision 96,7%, f1-score 98,3% dan nilai AUC sebesar 99,2%. Informasi yang diperoleh dari analisis sentimen SFS UNEJ diperoleh kata yang mengarah positif  yaitu “bagus”, “mantap”, “keren”, “bantu”, “lumayan”, “lebihbaik”, “mudah”, “unej” dan “suka”. Kata yang mengarah pada sentimen negatif yaitu “eror”, “tidakbisa”, “presensi”, “jelek”, “update”, “ribet”, “sulit”, “forceclose” dan “qrcode”.


Kata Kunci


Random Forest, SMOTE, Analisis Sentimen, Sister for Students


Teks Lengkap:

PDF


Referensi


[1] W. E. Nurjanah, R. Setya Perdana, and M. A. Fauzi, “Analisis sentimen terhadap tayangan televisi berdasarkan opini masyarakat pada media sosial twitter menggunakan metode k-kearest neighbor dan pembobotan jumlah retweet,” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 1, no. 12, pp. 1750–1757, 2017.

[2] R. Siringoringo, “Klasifikasi data tidak Seimbang menggunakan algoritma SMOTE dan k-nearest neighbor,” Jurnal ISD, vol. 3, no. 1, pp. 44–49, 2018.

[3] S. Chohan, A. Nugroho, A. Maezar Bayu Aji, W. Gata, and S. Nusa Mandiri, “Analisis sentimen aplikasi duolingo menggunakan metode naïve bayes dan synthetic minority over sampling technique,” Paradigma –Jurnal Informatika dan Komputer, vol. 22, no. 2, pp. 139–144, 2020.

[4] E. Fitri, Y. Yuliani, S. Rosyida, and W. Gata, “Analisis sentimen terhadap aplikasi ruangguru menggunakan algoritma naive bayes, random forest dan support vector machine,” Transformatika, vol. 18, no. 1, pp. 71–80, 2020.

[5] A. S. Neogi, K. A. Garg, R. K. Mishra, and Y. K. Dwivedi, “Sentiment analysis and classification of Indian farmers’ protest using twitter data,” International Journal of Information Management Data Insights, vol. 1, no. 2, Nov. 2021.

[6] A. Yolanda, “Perancangan Ulang User Interface (Ui) Dan User Experience (Ux) Menggunakan Metode Lean UX Pada Aplikasi Sister for Students (Sfs) Universitas Jember,” Universitas Jember, Jember, 2020.

[7] F. A. Nugraha, N. H. Harani, and R. Habibi, Analisis Sentimen Terhadap Pembatasan Sosial Menggunakan Deep Learning, Pertama. Pertama.Bandung: Kreatif Industri Nusantara, 2020.

[8] O. W. Purbo, Text Mining Analisis MedSos, Kekuatan Brand & Intelijen di Internet. Yogyakarta: ANDI, 2019.

[9] J. D. C. Aruan, B. Rahayudi, and A. Ridok, “Analisis sentimen opini Masyarakat terhadap pelayanan rumah sakit umum daerah menggunakan metode support vector machine dan rerm frequency-inverse document frequency,” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 6, no. 5, pp. 2072–2078, 2022.

[10] S. Jabri, A. Dahbi, and T. Gadi, “Ranking of text documents using TF-IDF weighting and association rules mining,” in International Conference on Optimization (ICOA), 2018, pp. 26–27.

[11] N. V Chawla, K. W. Bowyer, L. O. Hall, and W. P. Kegelmeyer, “SMOTE: Synthetic Minority Over-sampling Technique,” Journal of Artificial Intelligence Research, vol. 16, pp. 321–357, 2002.

[12] N. P. Y. T. Wijayanti, E. N. Kencana, and I. W. Sumarjaya, “SMOTE: potensi dan kekurangannya pada survei,” E-Jurnal Matematika, vol. 10, no. 4, p. 235, Nov. 2021.

[13] I. Saputra and D. A. Kristiyanti, Machine Learning Untuk Pemula. Informatika Bandung, 2022.

[14] B. Purnama, Pengantar Machine Learning. Bandung. Informatika Bandung, 2019.

[15] R. Mayapada, R. W. Yanti, and S. Syarifuddin, “Analisis tingkat kepentingan terhadap faktor-faktor yang mempengaruhi indeks pembangunan manusia di indonesia,” JOMTA Journal of Mathematics: Theory and Applications, vol. 4, no. 2, pp. 45–49, 2022.

[16] A. F. Hadi, A. F. Zulva, M. L. Hakim, M. D. Saputra, and H. Sadiyah, “Implementasi Explainable Machine Learning: Visualisasi Global Explainability and Local Interpretability pada Analisis Sentimen dengan SHAP dan LIME,” E-Journal BIAStatistics Departemen Statistika FMIPA Universitas Padjadjaran, vol. 17, no. 1, pp. 1–18, 2023.

[17] C. Molnar, Interpretable Machine Learning a Guide for Making Black Box Models Explainable. Germany: Lean Publishing, 2019.


Artikel Statistik

Abstrak telah dilihat : 418 kali
PDF telah dilihat : 237 kali

Refbacks

  • Saat ini tidak ada refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

 

Alamat Redaksi :
Departemen Sistem Informasi, Fakultas Teknologi Informasi
Universitas Andalas
Kampus Limau Manis, Padang 25163, Sumatera Barat

email: teknosi@fti.unand.ac.id

  Jumlah Pengunjung :

 

Creative Commons License
This work by JSI-Unand and licensed under a CC BY-SA 4.0 International License.