Pemodelan Text Mining dalam Pengkodean Penyakit Pasien Berdasar Kode ICD 10

Penulis

  • Parjono Parjono Teknik Informatika, Fakultas Teknologi Industri, Universitas Islam Indonesia
  • Sri Kusumadewi Teknik Informatika, Fakultas Teknologi Industri, Universitas Islam Indonesia

DOI:

https://doi.org/10.25077/TEKNOSI.v9i2.2023.200-207

Kata Kunci:

rekam medis, text mining, machine learning, neural network, ICD 10

Abstrak

Pengkodean penyakit yang lazim dilakukan oleh Rumah Sakit adalah menggunakan 2 metode, yang pertama adalah klinisi/ dokter menuliskan numenklatur penyakit berdasarkan kode ICD-10 dengan panduan kamus ICD-10 yang dapat berupa elektronik maupun buku. Metode kedua adalah klinisi/ dokter menulis secara free-text kemudian petugas koding dari rekam medis yang memberikan kode penyakit berdasar kode ICD-10 dan apabila ada hal yang sekiranya diragukan, petugas koding akan mengkonfirmasi ke dokter yang merawat pasien. Dari kebanyakan diagnosis medis yang berupa deskripsi free-text, kemiripan makna serta istilah medis yang memiliki kekhususan daripada istilah umum akan menjadi tantangan tersendiri dalam mengekstrak informasi yang berada di dalamnya. Hal ini yang mendorong penulis untuk membuat pendekatan koding penyakit dengan pememodelkan Text Mining dalam membantu pengkodean penyakit tersebut melalui data diagnosis dokter sehingga diharapkan proses pengkodean penyakit menjadi lebih cepat dan mengurangi aspek human error khususnya untuk penyakit di Indonesia. Metode pendekatan yang diterapkan adalah Clinical Text Mining dengan Natural Language Processing dimana metode ini dirasa paling tepat untuk mengekstraksi informasi dari diagnosis dokter yang tidak terstruktur. Data diambil dari Rumah Sakit bagian poliklinik penyakit dalam sejumlah 3787 data dengan 5 kategori kode ICD 10 yakni E11.9 Type 2 diabetes mellitus without complications, I10 Essential (primary) hypertension, I11.9 Hypertensive heart disease without (congestive) heart failure, K21.9 Gastro-oesophageal reflux disease without oesophagitis, K30 Functional dyspepsia  dengan pembagian komposisi data untuk training dan testing adalah 70:30 proses ekstraksi melalui tahapan case folding, contraction untuk pencocokan dengan kamus singkatan, tokenization, stop word removal dan menggunakan word2vec untuk proses konversi kata yang berupa karakter alphanumeric kedalam bentuk vector dari hasil pemodelan menggunakan Neural Network didapatkan nilai performa model cukup baik yakni memiliki akurasi 86.8%.

Referensi

[1] Y. Chen, H. Lu, and L. Li, “Automatic ICD-10 coding algorithm using an improved longest common subsequence based on semantic similarity,†PLoS One, vol. 12, no. 3, p. e0173410, 2017. [2] H. Dalianis, Clinical text mining: Secondary use of electronic patient records. Springer Nature, 2018. [3] D. M. Agustine and R. D. Pratiwi, “Hubungan Ketepatan Terminologi Medis dengan Keakuratan Kode Diagnosis Rawat Jalan oleh Petugas Kesehatan di Puskesmas Bambanglipuro Bantul,†Jurnal Kesehatan Vokasional, vol. 2, no. 1, pp. 113–121, 2017. [4] L. Zhou, C. Cheng, D. Ou, and H. Huang, “Construction of a semi-automatic ICD-10 coding system,†BMC Med Inform Decis Mak, vol. 20, pp. 1–12, 2020. [5] S. Boytcheva, “Automatic matching of ICD-10 codes to diagnoses in discharge letters,†in Proceedings of the second workshop on biomedical natural language processing, 2011, pp. 11–18. [6] U. Raja, T. Mitchell, T. Day, and J. M. Hardin, “Text mining in healthcare. Applications and opportunities,†J Healthc Inf Manag, vol. 22, no. 3, pp. 52–56, 2008. [7] S. Wang et al., “Using Deep Learning for Automatic Icd-10 Classification from FreeText Data,†Eur J Biomed Inform, vol. 16, no. 1, pp. 1–10, 2020. [8] N. N. Widyastuti, A. A. Bijaksana, and I. L. Sardi, “Analisis word2vec untuk perhitungan kesamaan semantik antar kata,†eProceedings of Engineering, vol. 5, no. 3, 2018. [9] Y. Wang et al., “MedSTS: a resource for clinical semantic textual similarity,†Lang Resour Eval, vol. 54, pp. 57–72, 2020. [10] L. Pereira, R. Rijo, C. Silva, and M. Agostinho, “ICD9-based text mining approach to children epilepsy classification,†Procedia Technology, vol. 9, pp. 1351–1360, 2013. [11] J. Nielsen, “Usability 101: Introduction to Usability,†https://www.nngroup.com/articles/usability-101-introduction-to-usability. [12] D. R. Prajapat, “Text Classification: BERT vs DNN,†https://eng.zemosolabs.com/text-classification-bert-vs-dnn-b226497c9de7. [13] M. K. Ross, W. Wei, and L. Ohno-Machado, “‘Big data’ and the electronic health record,†Yearb Med Inform, vol. 23, no. 01, pp. 97–104, 2014. [14] R. Mahmoud, N. El-Bendary, H. M. O. Mokhtar, and A. E. Hassanien, “ICF based automation system for spinal cord injuries rehabilitation,†in 2014 9th International Conference on Computer Engineering & Systems (ICCES), IEEE, 2014, pp. 192–197. [15] Y. Mardi, “Data Mining Rekam Medis Untuk Menentukan Penyakit Terbanyak Menggunakan Decision Tree C4. 5,†Jurnal Sains dan Informatika: Research of Science and Informatic, vol. 4, no. 1, pp. 40–53, 2018.

Unduhan

Telah diserahkan

15-05-2023

Diterima

11-09-2023

Diterbitkan

16-09-2023

Cara Mengutip

[1]
P. Parjono dan S. Kusumadewi, “Pemodelan Text Mining dalam Pengkodean Penyakit Pasien Berdasar Kode ICD 10”, TEKNOSI, vol. 9, no. 2, hlm. 200–207, Sep 2023.

Terbitan

Bagian

Articles