Optimasi Pengelompokan Data Pada Metode K-means dengan Analisis Outlier
DOI:
https://doi.org/10.25077/TEKNOSI.v5i2.2019.88-95Keywords:
Deteksi, Clustering, K-Means, Outlier.Abstract
Data mining secara umum adalah proses analisis dan eksplorasi sejumlah besar data yang berbeda untuk menemukan pola yang bermakna. . Berbagai teknik tersedia dalam data mining untuk ekstraksi pengetahuan antara lain klasifikasi, prediksi, estimasi, asosiasi dan pengelompokan. Salah satu metode pengelompokan yang terkenal adalah metode k-means karena kesederhanaan dan efesiensinya, sehingga metode ini mudah diaplikasikan di berbagai bidang. Teknik pra-pemrosesan data diterapkan pada data mentah untuk membuat data bersih, bebas noise, dan konsisten. Dalam data mining terdapat beberapa metode yang dapat digunakan tergantung dari tujuan yang akan dicapai. Deteksi outlier adalah penelitian dari data mining untuk mendeteksi kasus – kasus abnormal pada database. Peneltian ini bertujuan mengetahui penerapan metode local outlier factor untuk optimasi pada metode k-means clustering. Hasil dari penelitian, pengunaan metode local outlier factor pada data capaian kinerja pegawai dapat mendeteksi data outlier sebesar 22.8%. Rata – rata iterasi, nilai SSE dan waktu komputasi untuk satu kali konvergen pada metode k-means dengan analisis outlier memberikan hasil yang lebih baik untuk jumlah cluster 2 – 10 dibandingkan dengan metode k-means tradisional.References
[1] V. Bhatt, M. Dhakar, Dan B. K. Chaurasia, “Filtered Clustering Based On Local Outlier Factor In Data Mining,†Int. J. Database Theory Appl., Vol. 9, No. 5, Hal. 275–282, 2016. [2] G. Gustientiedina, M. H. Adiya, Dan Y. Desnelita, “Jurnal Nasional Teknologi Dan Sistem Informasi Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan Pada Rsud Pekanbaru,†J. Nas. Teknol. Dan Sist. Inf., Vol. 05, No. 01, Hal. 17–24, 2019. [3] K. Handoko, “Penerapan Data Mining Dalam Meningkatkan Mutu Pembelajaran Pada Instansi Perguruan Tinggi Menggunakan Metode K - Means Clustering ( Studi Kasus Di Program Studi Tkj Akademi Komunitas Solok Selatan ),†Vol. 02, No. 03, Hal. 31–40, 2016. [4] K. G. Sharma, Y. Singh, Dan A. K. Srivastava, “Variance On Outlier Factor,†In Impact, 2017, Hal. 101–103. [5] M. R. Ridlo, S. Defiyanti, Dan A. Primajaya, “Implementasi Algoritme K-Means Untuk Pemetaan Produktivitas Panen Padi Di Kabupaten Karawang,†In Citee 2017, 2017, Hal. 426–433. [6] N. Idham, “Penerapan Outlier Analysis Sebagai Salah Satu Rekomendasi Kelompok Belajar Terhadap Siswa Kelas 6 Di Sdn Pagelaran Ii Program Studi Teknik Informatika,†Universitas Komputer Indonesia, 2017. [7] K. Kaur Dan A. Garg, “Comparative Study Of Outlier Detection Algorithms,†Int. J. Comput. Appl. (0975, Vol. 147, No. 9, Hal. 21–26, 2016. [8] D. Maryono Dan A. Djunaidy, “Berbasis Klaster Pada Set Data Dengan Atribut Campuran Numerik Dan Kategorikal *,†J. Ilm. Kursor, Vol. 5, No. 3, Hal. 197–204, 2010. [9] Y. Yan, L. Cao, C. Kuhlman, Dan E. Rundensteiner, “Distributed Local Outlier Detection In Big Data,†In Kdd 2017 Research Paper, 2017, Hal. 1225–1234. [10] A. Mahendra, “Pentapisan Dan Deteksi Data Outlier Dalam Proses Sistem Akusisi Data Pada Proses Sintering,†Arsitron, Vol. 6, No. 1, Hal. 1–7, 2015. [11] J. Wang Dan X. Su, “An Improved K-Means Clustering Algorithm,†In 2011 Ieee 3rd International Conference On Communication Software And Networks, 2011, Hal. 44–46. [12] G. Ngurah, W. Paramartha, D. E. Ratnawati, Dan A. W. Widodo, “Analisis Perbandingan Metode K-Means Dengan Improved Semi- Supervised K-Means Pada Data Indeks Pembangunan Manusia ( Ipm ),†Vol. 1, No. 9, Hal. 813–824, 2017. [13] Pamula, J. K. Deka, Dan S. Nandi, “An Outlier DetectionMethod Based On Clustering,†In Second International Conference On Emerging Applications Of Information Technology, 2011, Hal. 253–256. [14] H. C. Mandhare Dan S. R. Idate, “Distance Based Outlier Detection And Density Based Outlier Detection Techniques,†In International Conference On Intelligent Computing And Control Systems, 2017, Hal. 931–935. [15] N. B. Hartono, “Analisis Outlier Dan Heteroskedastisitas Dengan Menggunakan Regresi Robust Weight Least Square,†Universitas Negeri Semarang, 2016. [16] W. Wang Dan P. Lu, “An Ef Fi Cient Switching Median Filter Based On Local Outlier Factor,†Ieee Signal Process. Lett., Vol. 18, No. 10, Hal. 551–554, 2011. [17] B. Santoso, I. Cholissodin, Dan B. D. Setiawan, “Optimasi K-Means Untuk Clustering Kinerja Akademik Dosen Menggunakan Algoritme Genetika,†J. Pengemb. Teknol. Inf. Dan Ilmu Komput., Vol. 1, No. 12, Hal. 1652–1659, 2017. [18] E. A. Sari, “Penerapan Algoritma K-Means Untuk Menentukan Tingkat Kesehatan Bayi Dan Balita Pada Kabupaten Dan Kota Di Jawa Tengah,†Universitas Dian Nuswantoro, 2015.
Downloads
Submitted
Accepted
Published
How to Cite
Issue
Section
License
Hak cipta untuk artikel ini ditransfer ke Jurnal Nasional Teknologi dan Sistem Informasi (TEKNOSI) jika dan ketika artikel diterima untuk publikasi. Yang bertanda tangan di bawah ini dengan ini mentransfer setiap dan semua hak di dalam dan ke kertas termasuk tanpa batasan semua hak cipta untuk TEKNOSI. Yang bertanda tangan di bawah ini dengan ini menyatakan dan menjamin bahwa makalah tersebut asli dan bahwa ia adalah pembuat makalah, kecuali untuk bahan yang secara jelas diidentifikasi sebagai sumber aslinya, dengan pemberitahuan izin dari pemilik hak cipta jika diperlukan. Yang bertanda tangan di bawah ini menyatakan bahwa ia memiliki kekuatan dan wewenang untuk membuat dan melaksanakan penugasan ini.
Kami menyatakan bahwa:
- Makalah ini belum diterbitkan dalam bentuk yang sama di tempat lain.
- Makalah ini tidak akan dikirimkan di tempat lain untuk publikasi sebelum penerimaan/penolakan oleh Jurnal ini
- Izin hak cipta diperoleh untuk materi yang diterbitkan di tempat lain dan yang memerlukan izin ini untuk reproduksi.
Selanjutnya, Saya/kami dengan ini mentransfer hak publikasi yang tidak terbatas dari makalah yang disebutkan di atas secara keseluruhan kepada TEKNOSI. Transfer hak cipta mencakup hak untuk mereproduksi dan mendistribusikan artikel, termasuk cetak ulang, terjemahan, reproduksi foto, mikroform, bentuk elektronik (offline, online) atau reproduksi lain yang serupa.
Penulis yang sesuai menandatangani dan menerima tanggung jawab untuk merilis materi ini atas nama setiap dan semua penulis bersama. Perjanjian ini harus ditandatangani oleh setidaknya salah satu penulis yang telah memperoleh persetujuan dari rekan penulis jika berlaku. Setelah pengajuan perjanjian ini ditandatangani oleh penulis yang sesuai, perubahan kepengarangan atau dalam urutan penulis yang tercantum tidak akan diterima.
Hak / Syarat dan Ketentuan yang dipertahankan :
- Penulis memiliki semua hak kepemilikan dalam setiap proses, prosedur, atau artikel manufaktur yang dijelaskan dalam Karya ini.
- Penulis dapat mereproduksi atau mengotorisasi orang lain untuk mereproduksi karya ini atau karya turunannya untuk penggunaan pribadi penulis atau untuk penggunaan perusahaan, dengan ketentuan bahwa sumber dan menyatakan hak cipta dimiliki TEKNOSI, salinan tidak digunakan dengan cara apa pun yang menyiratkan pengesahan TEKNOSI atas suatu produk atau layanan dari pihak mana pun, dan salinannya sendiri tidak ditawarkan untuk dijual.
- Meskipun penulis diizinkan untuk menggunakan kembali semua atau sebagian dari karya ini dalam karya lain, ini tidak termasuk mengabulkan permintaan pihak ketiga untuk mencetak ulang, menerbitkan ulang, atau jenis penggunaan ulang lainnya.