Optimasi Pengelompokan Data Pada Metode K-means dengan Analisis Outlier

Penulis

  • Pasek Agus Ariawan Program Studi Magister Teknik elektro, Fakultas Teknik, Universitas Udayana

DOI:

https://doi.org/10.25077/TEKNOSI.v5i2.2019.88-95

Kata Kunci:

Deteksi, Clustering, K-Means, Outlier.

Abstrak

Data mining secara umum adalah proses analisis dan eksplorasi sejumlah besar data yang berbeda untuk menemukan pola yang bermakna. . Berbagai teknik tersedia dalam data mining untuk ekstraksi pengetahuan antara lain klasifikasi, prediksi, estimasi, asosiasi dan pengelompokan. Salah satu metode pengelompokan yang terkenal adalah metode k-means karena kesederhanaan dan efesiensinya, sehingga metode ini mudah diaplikasikan di berbagai bidang. Teknik pra-pemrosesan data diterapkan pada data mentah untuk membuat data bersih, bebas noise, dan konsisten. Dalam data mining terdapat beberapa metode yang dapat digunakan tergantung dari tujuan yang akan dicapai. Deteksi outlier adalah penelitian dari data mining untuk mendeteksi kasus – kasus abnormal pada database. Peneltian ini bertujuan mengetahui penerapan metode local outlier factor untuk optimasi pada metode k-means clustering. Hasil dari penelitian, pengunaan metode local outlier factor pada data capaian kinerja pegawai dapat mendeteksi data outlier sebesar 22.8%. Rata – rata iterasi, nilai SSE dan waktu komputasi untuk satu kali konvergen pada metode k-means dengan analisis outlier memberikan hasil yang lebih baik untuk jumlah cluster 2 – 10 dibandingkan dengan metode k-means tradisional.

Referensi

[1] V. Bhatt, M. Dhakar, Dan B. K. Chaurasia, “Filtered Clustering Based On Local Outlier Factor In Data Mining,†Int. J. Database Theory Appl., Vol. 9, No. 5, Hal. 275–282, 2016. [2] G. Gustientiedina, M. H. Adiya, Dan Y. Desnelita, “Jurnal Nasional Teknologi Dan Sistem Informasi Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan Pada Rsud Pekanbaru,†J. Nas. Teknol. Dan Sist. Inf., Vol. 05, No. 01, Hal. 17–24, 2019. [3] K. Handoko, “Penerapan Data Mining Dalam Meningkatkan Mutu Pembelajaran Pada Instansi Perguruan Tinggi Menggunakan Metode K - Means Clustering ( Studi Kasus Di Program Studi Tkj Akademi Komunitas Solok Selatan ),†Vol. 02, No. 03, Hal. 31–40, 2016. [4] K. G. Sharma, Y. Singh, Dan A. K. Srivastava, “Variance On Outlier Factor,†In Impact, 2017, Hal. 101–103. [5] M. R. Ridlo, S. Defiyanti, Dan A. Primajaya, “Implementasi Algoritme K-Means Untuk Pemetaan Produktivitas Panen Padi Di Kabupaten Karawang,†In Citee 2017, 2017, Hal. 426–433. [6] N. Idham, “Penerapan Outlier Analysis Sebagai Salah Satu Rekomendasi Kelompok Belajar Terhadap Siswa Kelas 6 Di Sdn Pagelaran Ii Program Studi Teknik Informatika,†Universitas Komputer Indonesia, 2017. [7] K. Kaur Dan A. Garg, “Comparative Study Of Outlier Detection Algorithms,†Int. J. Comput. Appl. (0975, Vol. 147, No. 9, Hal. 21–26, 2016. [8] D. Maryono Dan A. Djunaidy, “Berbasis Klaster Pada Set Data Dengan Atribut Campuran Numerik Dan Kategorikal *,†J. Ilm. Kursor, Vol. 5, No. 3, Hal. 197–204, 2010. [9] Y. Yan, L. Cao, C. Kuhlman, Dan E. Rundensteiner, “Distributed Local Outlier Detection In Big Data,†In Kdd 2017 Research Paper, 2017, Hal. 1225–1234. [10] A. Mahendra, “Pentapisan Dan Deteksi Data Outlier Dalam Proses Sistem Akusisi Data Pada Proses Sintering,†Arsitron, Vol. 6, No. 1, Hal. 1–7, 2015. [11] J. Wang Dan X. Su, “An Improved K-Means Clustering Algorithm,†In 2011 Ieee 3rd International Conference On Communication Software And Networks, 2011, Hal. 44–46. [12] G. Ngurah, W. Paramartha, D. E. Ratnawati, Dan A. W. Widodo, “Analisis Perbandingan Metode K-Means Dengan Improved Semi- Supervised K-Means Pada Data Indeks Pembangunan Manusia ( Ipm ),†Vol. 1, No. 9, Hal. 813–824, 2017. [13] Pamula, J. K. Deka, Dan S. Nandi, “An Outlier DetectionMethod Based On Clustering,†In Second International Conference On Emerging Applications Of Information Technology, 2011, Hal. 253–256. [14] H. C. Mandhare Dan S. R. Idate, “Distance Based Outlier Detection And Density Based Outlier Detection Techniques,†In International Conference On Intelligent Computing And Control Systems, 2017, Hal. 931–935. [15] N. B. Hartono, “Analisis Outlier Dan Heteroskedastisitas Dengan Menggunakan Regresi Robust Weight Least Square,†Universitas Negeri Semarang, 2016. [16] W. Wang Dan P. Lu, “An Ef Fi Cient Switching Median Filter Based On Local Outlier Factor,†Ieee Signal Process. Lett., Vol. 18, No. 10, Hal. 551–554, 2011. [17] B. Santoso, I. Cholissodin, Dan B. D. Setiawan, “Optimasi K-Means Untuk Clustering Kinerja Akademik Dosen Menggunakan Algoritme Genetika,†J. Pengemb. Teknol. Inf. Dan Ilmu Komput., Vol. 1, No. 12, Hal. 1652–1659, 2017. [18] E. A. Sari, “Penerapan Algoritma K-Means Untuk Menentukan Tingkat Kesehatan Bayi Dan Balita Pada Kabupaten Dan Kota Di Jawa Tengah,†Universitas Dian Nuswantoro, 2015.

Unduhan

Telah diserahkan

15-07-2019

Diterima

06-09-2019

Diterbitkan

19-09-2019

Cara Mengutip

[1]
P. A. Ariawan, “Optimasi Pengelompokan Data Pada Metode K-means dengan Analisis Outlier”, TEKNOSI, vol. 5, no. 2, hlm. 88–95, Sep 2019.

Terbitan

Bagian

Articles

Artikel Serupa

Anda juga bisa Mulai pencarian similarity tingkat lanjut untuk artikel ini.