Optimasi Pengelompokan Data Pada Metode K-means dengan Analisis Outlier

Authors

  • Pasek Agus Ariawan Program Studi Magister Teknik elektro, Fakultas Teknik, Universitas Udayana

DOI:

https://doi.org/10.25077/TEKNOSI.v5i2.2019.88-95

Keywords:

Deteksi, Clustering, K-Means, Outlier.

Abstract

Data mining secara umum adalah proses analisis dan eksplorasi sejumlah besar data yang berbeda untuk menemukan pola yang bermakna. . Berbagai teknik tersedia dalam data mining untuk ekstraksi pengetahuan antara lain klasifikasi, prediksi, estimasi, asosiasi dan pengelompokan. Salah satu metode pengelompokan yang terkenal adalah metode k-means karena kesederhanaan dan efesiensinya, sehingga metode ini mudah diaplikasikan di berbagai bidang. Teknik pra-pemrosesan data diterapkan pada data mentah untuk membuat data bersih, bebas noise, dan konsisten. Dalam data mining terdapat beberapa metode yang dapat digunakan tergantung dari tujuan yang akan dicapai. Deteksi outlier adalah penelitian dari data mining untuk mendeteksi kasus – kasus abnormal pada database. Peneltian ini bertujuan mengetahui penerapan metode local outlier factor untuk optimasi pada metode k-means clustering. Hasil dari penelitian, pengunaan metode local outlier factor pada data capaian kinerja pegawai dapat mendeteksi data outlier sebesar 22.8%. Rata – rata iterasi, nilai SSE dan waktu komputasi untuk satu kali konvergen pada metode k-means dengan analisis outlier memberikan hasil yang lebih baik untuk jumlah cluster 2 – 10 dibandingkan dengan metode k-means tradisional.

References

[1] V. Bhatt, M. Dhakar, Dan B. K. Chaurasia, “Filtered Clustering Based On Local Outlier Factor In Data Mining,†Int. J. Database Theory Appl., Vol. 9, No. 5, Hal. 275–282, 2016. [2] G. Gustientiedina, M. H. Adiya, Dan Y. Desnelita, “Jurnal Nasional Teknologi Dan Sistem Informasi Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan Pada Rsud Pekanbaru,†J. Nas. Teknol. Dan Sist. Inf., Vol. 05, No. 01, Hal. 17–24, 2019. [3] K. Handoko, “Penerapan Data Mining Dalam Meningkatkan Mutu Pembelajaran Pada Instansi Perguruan Tinggi Menggunakan Metode K - Means Clustering ( Studi Kasus Di Program Studi Tkj Akademi Komunitas Solok Selatan ),†Vol. 02, No. 03, Hal. 31–40, 2016. [4] K. G. Sharma, Y. Singh, Dan A. K. Srivastava, “Variance On Outlier Factor,†In Impact, 2017, Hal. 101–103. [5] M. R. Ridlo, S. Defiyanti, Dan A. Primajaya, “Implementasi Algoritme K-Means Untuk Pemetaan Produktivitas Panen Padi Di Kabupaten Karawang,†In Citee 2017, 2017, Hal. 426–433. [6] N. Idham, “Penerapan Outlier Analysis Sebagai Salah Satu Rekomendasi Kelompok Belajar Terhadap Siswa Kelas 6 Di Sdn Pagelaran Ii Program Studi Teknik Informatika,†Universitas Komputer Indonesia, 2017. [7] K. Kaur Dan A. Garg, “Comparative Study Of Outlier Detection Algorithms,†Int. J. Comput. Appl. (0975, Vol. 147, No. 9, Hal. 21–26, 2016. [8] D. Maryono Dan A. Djunaidy, “Berbasis Klaster Pada Set Data Dengan Atribut Campuran Numerik Dan Kategorikal *,†J. Ilm. Kursor, Vol. 5, No. 3, Hal. 197–204, 2010. [9] Y. Yan, L. Cao, C. Kuhlman, Dan E. Rundensteiner, “Distributed Local Outlier Detection In Big Data,†In Kdd 2017 Research Paper, 2017, Hal. 1225–1234. [10] A. Mahendra, “Pentapisan Dan Deteksi Data Outlier Dalam Proses Sistem Akusisi Data Pada Proses Sintering,†Arsitron, Vol. 6, No. 1, Hal. 1–7, 2015. [11] J. Wang Dan X. Su, “An Improved K-Means Clustering Algorithm,†In 2011 Ieee 3rd International Conference On Communication Software And Networks, 2011, Hal. 44–46. [12] G. Ngurah, W. Paramartha, D. E. Ratnawati, Dan A. W. Widodo, “Analisis Perbandingan Metode K-Means Dengan Improved Semi- Supervised K-Means Pada Data Indeks Pembangunan Manusia ( Ipm ),†Vol. 1, No. 9, Hal. 813–824, 2017. [13] Pamula, J. K. Deka, Dan S. Nandi, “An Outlier DetectionMethod Based On Clustering,†In Second International Conference On Emerging Applications Of Information Technology, 2011, Hal. 253–256. [14] H. C. Mandhare Dan S. R. Idate, “Distance Based Outlier Detection And Density Based Outlier Detection Techniques,†In International Conference On Intelligent Computing And Control Systems, 2017, Hal. 931–935. [15] N. B. Hartono, “Analisis Outlier Dan Heteroskedastisitas Dengan Menggunakan Regresi Robust Weight Least Square,†Universitas Negeri Semarang, 2016. [16] W. Wang Dan P. Lu, “An Ef Fi Cient Switching Median Filter Based On Local Outlier Factor,†Ieee Signal Process. Lett., Vol. 18, No. 10, Hal. 551–554, 2011. [17] B. Santoso, I. Cholissodin, Dan B. D. Setiawan, “Optimasi K-Means Untuk Clustering Kinerja Akademik Dosen Menggunakan Algoritme Genetika,†J. Pengemb. Teknol. Inf. Dan Ilmu Komput., Vol. 1, No. 12, Hal. 1652–1659, 2017. [18] E. A. Sari, “Penerapan Algoritma K-Means Untuk Menentukan Tingkat Kesehatan Bayi Dan Balita Pada Kabupaten Dan Kota Di Jawa Tengah,†Universitas Dian Nuswantoro, 2015.

Submitted

2019-07-15

Accepted

2019-09-06

Published

2019-09-19

How to Cite

[1]
P. A. Ariawan, “Optimasi Pengelompokan Data Pada Metode K-means dengan Analisis Outlier”, TEKNOSI, vol. 5, no. 2, pp. 88–95, Sep. 2019.

Similar Articles

You may also start an advanced similarity search for this article.