Optimasi Pengelompokan Data Pada Metode K-means dengan Analisis Outlier

Pasek Agus Ariawan(1*)
(1) Program Studi Magister Teknik elektro, Fakultas Teknik, Universitas Udayana
(*) Corresponding Author



Abstrak


Data mining secara umum adalah proses analisis dan eksplorasi sejumlah besar data yang berbeda untuk menemukan pola yang bermakna. . Berbagai teknik tersedia dalam data mining untuk ekstraksi pengetahuan antara lain klasifikasi, prediksi, estimasi, asosiasi dan pengelompokan. Salah satu metode pengelompokan yang terkenal adalah metode k-means karena kesederhanaan dan efesiensinya, sehingga metode ini mudah diaplikasikan di berbagai bidang. Teknik pra-pemrosesan data diterapkan pada data mentah untuk membuat data bersih, bebas noise, dan konsisten. Dalam data mining terdapat beberapa metode yang dapat digunakan tergantung dari tujuan yang akan dicapai. Deteksi outlier adalah penelitian dari data mining untuk mendeteksi kasus – kasus abnormal pada database. Peneltian ini bertujuan mengetahui penerapan metode local outlier factor untuk optimasi pada metode k-means clustering. Hasil dari penelitian, pengunaan metode local outlier factor pada data capaian kinerja pegawai dapat mendeteksi data outlier sebesar 22.8%. Rata – rata iterasi, nilai SSE dan waktu komputasi untuk satu kali konvergen pada metode k-means dengan analisis outlier memberikan hasil yang lebih baik untuk jumlah cluster 2 – 10 dibandingkan dengan metode k-means tradisional.

Kata Kunci


Deteksi, Clustering, K-Means, Outlier.


Teks Lengkap:

PDF


Referensi


[1] V. Bhatt, M. Dhakar, Dan B. K. Chaurasia, “Filtered Clustering Based On Local Outlier Factor In Data Mining,” Int. J. Database Theory Appl., Vol. 9, No. 5, Hal. 275–282, 2016.

[2] G. Gustientiedina, M. H. Adiya, Dan Y. Desnelita, “Jurnal Nasional Teknologi Dan Sistem Informasi Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan Pada Rsud Pekanbaru,” J. Nas. Teknol. Dan Sist. Inf., Vol. 05, No. 01, Hal. 17–24, 2019.

[3] K. Handoko, “Penerapan Data Mining Dalam Meningkatkan Mutu Pembelajaran Pada Instansi Perguruan Tinggi Menggunakan Metode K - Means Clustering ( Studi Kasus Di Program Studi Tkj Akademi Komunitas Solok Selatan ),” Vol. 02, No. 03, Hal. 31–40, 2016.

[4] K. G. Sharma, Y. Singh, Dan A. K. Srivastava, “Variance On Outlier Factor,” In Impact, 2017, Hal. 101–103.

[5] M. R. Ridlo, S. Defiyanti, Dan A. Primajaya, “Implementasi Algoritme K-Means Untuk Pemetaan Produktivitas Panen Padi Di Kabupaten Karawang,” In Citee 2017, 2017, Hal. 426–433.

[6] N. Idham, “Penerapan Outlier Analysis Sebagai Salah Satu Rekomendasi Kelompok Belajar Terhadap Siswa Kelas 6 Di Sdn Pagelaran Ii Program Studi Teknik Informatika,” Universitas Komputer Indonesia, 2017.

[7] K. Kaur Dan A. Garg, “Comparative Study Of Outlier Detection Algorithms,” Int. J. Comput. Appl. (0975, Vol. 147, No. 9, Hal. 21–26, 2016.

[8] D. Maryono Dan A. Djunaidy, “Berbasis Klaster Pada Set Data Dengan Atribut Campuran Numerik Dan Kategorikal *,” J. Ilm. Kursor, Vol. 5, No. 3, Hal. 197–204, 2010.

[9] Y. Yan, L. Cao, C. Kuhlman, Dan E. Rundensteiner, “Distributed Local Outlier Detection In Big Data,” In Kdd 2017 Research Paper, 2017, Hal. 1225–1234.

[10] A. Mahendra, “Pentapisan Dan Deteksi Data Outlier Dalam Proses Sistem Akusisi Data Pada Proses Sintering,” Arsitron, Vol. 6, No. 1, Hal. 1–7, 2015.

[11] J. Wang Dan X. Su, “An Improved K-Means Clustering Algorithm,” In 2011 Ieee 3rd International Conference On Communication Software And Networks, 2011, Hal. 44–46.

[12] G. Ngurah, W. Paramartha, D. E. Ratnawati, Dan A. W. Widodo, “Analisis Perbandingan Metode K-Means Dengan Improved Semi- Supervised K-Means Pada Data Indeks Pembangunan Manusia ( Ipm ),” Vol. 1, No. 9, Hal. 813–824, 2017.

[13] Pamula, J. K. Deka, Dan S. Nandi, “An Outlier DetectionMethod Based On Clustering,” In Second International Conference On Emerging Applications Of Information Technology, 2011, Hal. 253–256.

[14] H. C. Mandhare Dan S. R. Idate, “Distance Based Outlier Detection And Density Based Outlier Detection Techniques,” In International Conference On Intelligent Computing And Control Systems, 2017, Hal. 931–935.

[15] N. B. Hartono, “Analisis Outlier Dan Heteroskedastisitas Dengan Menggunakan Regresi Robust Weight Least Square,” Universitas Negeri Semarang, 2016.

[16] W. Wang Dan P. Lu, “An Ef Fi Cient Switching Median Filter Based On Local Outlier Factor,” Ieee Signal Process. Lett., Vol. 18, No. 10, Hal. 551–554, 2011.

[17] B. Santoso, I. Cholissodin, Dan B. D. Setiawan, “Optimasi K-Means Untuk Clustering Kinerja Akademik Dosen Menggunakan Algoritme Genetika,” J. Pengemb. Teknol. Inf. Dan Ilmu Komput., Vol. 1, No. 12, Hal. 1652–1659, 2017.

[18] E. A. Sari, “Penerapan Algoritma K-Means Untuk Menentukan Tingkat Kesehatan Bayi Dan Balita Pada Kabupaten Dan Kota Di Jawa Tengah,” Universitas Dian Nuswantoro, 2015.


Artikel Statistik

Abstrak telah dilihat : 2299 kali
PDF telah dilihat : 1575 kali

Refbacks

  • Saat ini tidak ada refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

 

Alamat Redaksi :
Departemen Sistem Informasi, Fakultas Teknologi Informasi
Universitas Andalas
Kampus Limau Manis, Padang 25163, Sumatera Barat

email: teknosi@fti.unand.ac.id

  Jumlah Pengunjung :

 

Creative Commons License
This work by JSI-Unand and licensed under a CC BY-SA 4.0 International License.