ANALISIS KOMPARATIF METODE DATA MINING MULTISEKTOR PADA DATASET COVID-19, SAHAM BEI, DAN PERUSAHAAN GLOBAL

Satria Nur Fajriansyah, Harsya Rafif Pramadhan, Alaudin Safa, Dandy Nurfajriansyah, Muhammad Subaktiar Wijaya, Yuda Samudra

Abstract


The rapid advancement of information technology has significantly driven the adoption of data mining techniques across various sectors, primarily to uncover hidden patterns and support data-driven decision-making processes. This study aims to analyse and compare the effectiveness of several data mining methods—namely K-Means Clustering, Decision tree, Principal component analysis (PCA), and Bootstrapping—in processing datasets from three distinct domains: public health (COVID-19), finance (Indonesia Stock Exchange), and global business (multinational corporations). The datasets utilised include COVID-19 data sourced from Kaggle, stock data listed on the Indonesia Stock Exchange, and corporate data comprising industry classifications and revenue attributes of global companies. The methodology adopted in this research encompasses several critical phases: data preprocessing to ensure consistency and reliability; implementation of classification and clustering algorithms; and model evaluation through accuracy metrics and visual analytics. Findings indicate that the K-Means algorithm performs effectively in clustering both COVID-19 spread regions and stock data based on numerical features. The Decision tree method demonstrates strong predictive capabilities in classifying risk categories within both COVID-19 datasets and corporate profiles. PCA proves to be valuable in reducing data dimensionality while retaining essential information. Furthermore, Bootstrapping is employed to enhance the generalizability of the models, particularly in scenarios involving limited data samples. The study concludes that integrating multiple data mining approaches can yield comprehensive insights across sectors, although the level of effectiveness varies depending on the inherent characteristics of each dataset. Such a multidisciplinary and combined approach provides a robust framework for data-driven analysis and strategic decision support in diverse fields.

Kemajuan pesat dalam teknologi informasi telah memperluas pemanfaatan teknik data mining di berbagai bidang, khususnya dalam mengidentifikasi pola tersembunyi dan menunjang proses pengambilan keputusan berbasis data. Penelitian ini secara khusus mengkaji dan membandingkan efektivitas empat pendekatan data mining yakni K-Means Clustering, Decision tree, Principal component analysis (PCA), dan Bootstrapping, dalam mengolah data yang berasal dari tiga sektor strategis: sektor kesehatan (terkait COVID-19), sektor keuangan (pasar saham BEI), dan sektor bisnis global (perusahaan multinasional). Dataset yang digunakan bersumber dari berbagai platform terpercaya, termasuk data COVID-19 dari Kaggle, data saham perusahaan yang terdaftar di Bursa Efek Indonesia, serta informasi perusahaan multinasional yang mencakup variabel industri dan pendapatan tahunan. Rangkaian metodologi penelitian diawali dengan proses prapengolahan data (data preprocessing) untuk memastikan kualitas dan konsistensi data, dilanjutkan dengan penerapan algoritma klasifikasi dan pengelompokan (clustering), serta evaluasi performa model menggunakan metrik akurasi dan representasi visual. Dari hasil analisis yang dilakukan, ditemukan bahwa algoritma K-Means menunjukkan performa yang baik dalam mengelompokkan wilayah berdasarkan tingkat penyebaran COVID-19 serta dalam mengklasifikasikan saham berdasarkan indikator numerik. Sementara itu, metode Decision tree terbukti efektif dalam memprediksi kategori risiko, baik dalam konteks data kesehatan maupun data korporasi multinasional. PCA turut berkontribusi signifikan dalam mereduksi dimensi data tanpa kehilangan informasi utama yang relevan. Selain itu, teknik Bootstrapping diaplikasikan untuk meningkatkan kemampuan generalisasi model, terutama saat berhadapan dengan keterbatasan jumlah data. Secara keseluruhan, temuan penelitian ini menegaskan bahwa pendekatan kombinatif dalam data mining dapat menghasilkan wawasan mendalam yang lintas sektoral, dengan efektivitas yang bergantung pada karakteristik dan struktur data yang dianalisis. Pendekatan integratif semacam ini berpotensi memperkaya pemahaman dan mendukung pengambilan keputusan strategis di berbagai domain


Full Text:

PDF

References


Agustian, A. A., & Bisri, A. (2019). Data Mining Optimization Using Sample Bootstrapping and Particle Swarm Optimization in the Credit Approval Classification. Indonesian Journal of Artificial Intelligence and Data Mining (IJAIDM), 2(1), 18–27. https://doi.org/10.24014/ijaidm.v2i1.6299

Chen, Q. (2024). Application of K-Means Algorithm in Marketing. Advances in Economics, Management and Political Sciences, 71, 178–184. https://doi.org/10.54254/2754-1169/71/20241485

Hediyati, D., & Suartana, I. M. (2021). Penerapan Principal Component Analysis (PCA) Untuk Reduksi Dimensi Pada Proses Clustering Data Produksi Pertanian Di Kabupaten Bojonegoro. JIEET : Journal of Information Engineering and Educational Technology, 5(2), 49–54. https://doi.org/10.26740/jieet.v5n2.p49-54

Kurnia, A., Mirza, A. H., & Andri, A. (2020). Penerapan Decision Tree Data Mining Pada Produksi Kelapa Sawit PT Hindoli Di Sungai Lilin Kabupaten Musi Banyuasin. Jurnal Pengembangan Sistem Informasi Dan Informatika, 1(2), 84–99. https://doi.org/10.47747/jpsii.v1i2.168

Marisa, F., Maukar, A. L., & Akhriza, T. M. (2021). Data Mining Konsep dan Penerapannya. Yogyakarta : Deepublish.

Pradnyana, G. A., Darmawiguna, I. G. M., & Wijaya, I. N. S. W. (2020). Data Mining: Menemukan Pengetahuan dalam Data. Depok : PT Raja Grafindo Persada.

Rajkumar, S. (2020). COVID-19 in India: Dataset on Novel Corona virus disease 2019 in India.

Romero, C., & Ventura, S. (2020). Educational data mining and learning analytics: An updated survey. Wires: Data Mining & Knowledge Discovery, 10(3), e1355. https://doi.org/10.1002/widm.1355




DOI: https://doi.org/10.56486/jris.vol5no2.903

Article Metrics

Abstract view : 9 times
PDF - 5 times

Refbacks

  • There are currently no refbacks.


TERINDEKS OLEH :

Â