ANALISIS PERBANDINGAN ALGORITMA RANDOM FOREST DAN NAIVE BAYES DALAM KLASIFIKASI PENYAKIT AIDS
Abstract
This study aims to compare the performance of the Random Forest and Naïve Bayes algorithms in classifying AIDS based on patient data. The dataset was obtained from the Kaggle platform and consists of 2,139 data points with 23 attributes, including medical information such as age, weight, haemoglobin level, gender, treatment type, and CD4 and CD8 cell counts. The research method comprises several stages: data collection, pre-processing, model building, and evaluation. The model was evaluated using metrics such as accuracy, precision, recall, F1-score, confusion matrix, and AUC-ROC. The results showed that the Random Forest algorithm outperformed Naïve Bayes. Random Forest achieved an accuracy of 88.16% and an AUC of 91.25%, while Naïve Bayes only achieved an accuracy of 81.46% and an AUC of 81.40%. These findings indicate that Random Forest is better able to handle complex, non-linear medical data and provides more stable, reliable classification results. Therefore, Random Forest is recommended as a more effective algorithm for classifying AIDS cases based on the dataset used in this study.
Penelitian ini bertujuan untuk membandingkan kinerja algoritma Random Forest dan Naïve Bayes dalam melakukan klasifikasi penyakit AIDS berdasarkan data pasien. Dataset yang digunakan diperoleh dari platform Kaggle dan terdiri atas 2.139 data dengan 23 atribut, yang mencakup informasi medis seperti usia, berat badan, kadar hemoglobin, jenis kelamin, jenis pengobatan, serta jumlah sel CD4 dan CD8. Metode penelitian meliputi beberapa tahapan, yaitu pengumpulan data, pra-pemrosesan, pembentukan model, dan evaluasi. Model dievaluasi menggunakan metrik akurasi, presisi, recall, F1-score, confusion matrix, dan AUC- ROC. Hasil penelitian menunjukkan bahwa algoritma Random Forest memiliki performa lebih baik dibandingkan Naïve Bayes. Random Forest mencapai akurasi sebesar 88,16% dan nilai AUC sebesar 91,25%, sedangkan Naïve Bayes hanya memperoleh akurasi 81,46% dengan AUC 81,40%. Temuan ini menunjukkan bahwa Random Forest lebih mampu menangani data medis yang kompleks dan non-linear, serta memberikan hasil klasifikasi yang lebih stabil dan andal. Oleh karena itu, Random Forest direkomendasikan sebagai algoritma yang lebih efektif untuk klasifikasi kasus AIDS menggunakan dataset pada penelitian ini.
Full Text:
PDFReferences
Aini, R., Padmarini, A., & Sulistyo, A. (2025). Sensitivity and Specificity of Human Immunodeficiency Virus (HIV) Antibody Testing Using the Immunochromatography Method Rapid Test Compared to ECLIA (Electro Chemiluminescence Immuno Assay). Jaringan Laboratorium Medis, 7(2), 119–126. https://doi.org/10.31983/jlm.v7i2.13620
Barus, D. J., Arwina B., H., & Rajagukguk, D. L. (2024). Gambaran Pengetahuan Remaja Tentang Penyakit HIV/AIDS. TEKESNOS : Jurnal Teknologi, Kesehatan Dan Ilmu Sosial, 6(2), 63–70. https://e-journal.sari-mutiara.ac.id/index.php/tekesnos/article/view/5754
Cahyana, C. W., & Nurlayli, A. (2023). Analisis Performa Logistic Regression, Naïve Bayes, dan Random Forest sebagai Algoritma Pendeteksi Kanker Payudara. INSERT: Information System and Emerging Technology Journal, 4(1), 51–64. https://doi.org/10.23887/insert.v4i1.62362
Handayani, O. P. (2024). Revolusi Kesehatan Digital: Peran AI dan Pembelajaran Mesin dalam Diagnosa Perawatan. KORISA : Jurnal Kolaborasi Riset Sarjana, 1(2), 1–17. https://ejournal.uhb.ac.id/index.php/korisa/article/view/1773
Hanifah, L., & Kriswibowo, A. (2023). Kebijakan Penanggulangan HIV/Aids dalam Perspektif Health Policy Triangle Analysis di Kota Surabaya. MANHAJ: Jurnal Hukum Dan Pranata Sosial Islam, 5(1), 961–970. https://doi.org/10.37680/almanhaj.v5i1.2827
Lestari, I. I., & Homaidi, A. (2024). Komparasi Algoritma Naive Bayes Dan Random Forest Pada Klasifikasi Kanker Payudara. Gudang Jurnal Multidisiplin Ilmu, 2(12), 778–785. https://doi.org/10.59435/gjmi.v2i12.1206
Miftakhudin, A., Santoso, N. A., & Santoso, B. A. (2025). Komparasi Algoritma KNN dan Random Forest untuk Diagnosa Penyakit Jantung Koroner (Studi Kasus: RSUD Dr. Soeselo Slawi). RIGGS: Journal of Artificial Intelligence and Digital Business, 4(3), 2962–2971. https://doi.org/10.31004/riggs.v4i3.2424
Novelan, M. S., & Aryza, S. (2025). Belajar Mengenal Dasar Machine Learning. Payakumbuh : PT. Serasi Media Teknologi.
Oktavia, C., Suheti, T., Husni, A., & Melianingsih, L. (2022). Gambaran Pengetahuan Dan Sikap Remaja Tentang Pencegahan HIV/AIDS. Jurnal Keperawatan Indonesia Florence Nightingale, 2(1), 37–43. https://doi.org/10.34011/jkifn.v2i1.97
Oktaviana, A., Wijaya, D. P., Pramuntadi, A., & Heksaputra, D. (2024). Prediksi Penyakit Diabetes Melitus Tipe 2 Menggunakan Algoritma K-Nearest Neighbor (K-NN). MALCOM: Indonesian Journal of Machine Learning and Computer Science, 4(3), 812–818. https://doi.org/10.57152/malcom.v4i3.1268
Samosir, A., Hasibuan, M. S., Justino, W. E., & Hariyono, T. (2021). Komparasi Algoritma Random Forest, Naive Bayes dan K- Nearest Neighbor Dalam klasifikasi Data Penyakit Jantung. Prosiding Seminar Nasional Darmajaya, 214–222.
Sari, I. D., Rustiana, N., & Damayanti, A. E. (2024). Hubungan Karakteristik Demografi Dengan Pengetahuan Masyarakat Tentang HIV (Human Immunodeficiency Virus)/ Di RW 02 Kelurahan Pinang Ranti Jakarta-Timur. Jurnal Farmasi IKIFA, 3(3), 121–131. https://epik.ikifa.ac.id/jfi/article/view/237
Setiawan, A., Susanto, B., Wijaya, R. W. N., Tita, F., Indrajaya, D., Leipary, H., & Kurniawan, T. A. D. (2025). Pengantar Data Mining. Yogyakarta : Diandra Kreatif.
DOI: https://doi.org/10.56486/jeis.vol6no1.1002
Article Metrics
Abstract view : 50 timesPDF - 32 times
Refbacks
- There are currently no refbacks.
Copyright (c) 2026 Muhamad Tedi Saprudin, Budi Sudrajat, Hasta Herlan Asymar

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
TERINDEKS OLEH :


Â



