Academic Journal

Implementasi Data Mining Dalam Melakukan Prediksi Penyakit Diabetes Menggunakan Metode Random Forest Dan Xgboost

التفاصيل البيبلوغرافية
العنوان: Implementasi Data Mining Dalam Melakukan Prediksi Penyakit Diabetes Menggunakan Metode Random Forest Dan Xgboost
المؤلفون: Salsabil, Muhammad, Azizah, Nuril Lutvi, Eviyanti, Ade
المصدر: Jurnal Ilmiah Komputasi; Vol. 23 No. 1 (2024): Jurnal Ilmiah Komputasi : Vol. 23 No 1, Maret 2024; 51-58 ; 2549-7227 ; 1412-9434
بيانات النشر: Lembaga Penelitian dan Pengabdian Kepada Masyarakat
سنة النشر: 2024
المجموعة: STMIK Jakarta Journal Online
مصطلحات موضوعية: Data Mining, prediksi penyakit diabetes, Random Forest, XGBoost, evaluasi model, kaggle
الوصف: Penyakit diabetes telah menjadi isu global dalam bidang kesehatan. Penelitian ini berfokus pada implementasi dua teknik data mining yaitu Random Forest dan XGBoost untuk memproyeksikan perkembangan penyakit diabetes. Kedua metode ini memanfaatkan dataset klinis dan biokimia yang terkait dengan diabetes. Setelah fase preprocessing, dilakukan evaluasi performa menggunakan metrik evaluasi seperti akurasi, presisi, recall dan f1 score. Dataset yang digunakan sebanyak 768 entri dan 9 indikator yang diperoleh dari platform Kaggle. Dalam Penelitian ini data diolah melalui tahap preprocessing diantaranya handling missing value, handling outlier dan normalisasi data, dan didapatkan data yang akan diolah sebesar 688. Setelah didapat data hasil preprocessing, dilakukan tahapan pelatihan dan pengujian dengan Cross Validation dan dilakukan pengujian untuk mengetahui parameter-parameter terbaik yang akan digunakan, lalu dilakukan evaluasi kinerja model Random Forest dan XGBoost menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil evaluasi model menunjukkan performa yang baik dalam penelitian ini, didapatkan hasil akurasi keseluruhan dalam penggunaan random forest sebesar 74% dan penggunaan XGBoost sebesar 76%.Penyakit diabetes telah menjadi isu global dalam bidang kesehatan. Penelitian ini berfokus pada implementasi dua teknik data mining yaitu Random Forest dan XGBoost untuk memproyeksikan perkembangan penyakit diabetes. Kedua metode ini memanfaatkan dataset klinis dan biokimia yang terkait dengan diabetes. Setelah fase preprocessing, dilakukan evaluasi performa menggunakan metrik evaluasi seperti akurasi, presisi, recall dan f1 score. Dataset yang digunakan sebanyak 768 entri dan 9 indikator yang diperoleh dari platform Kaggle. Dalam Penelitian ini data diolah melalui tahap preprocessing diantaranya handling missing value, handling outlier dan normalisasi data, dan didapatkan data yang akan diolah sebesar 688. Setelah didapat data hasil preprocessing, dilakukan tahapan pelatihan dan pengujian dengan Cross ...
نوع الوثيقة: article in journal/newspaper
اللغة: English
Relation: https://ejournal.jak-stik.ac.id/index.php/komputasi/article/view/3507/783; https://ejournal.jak-stik.ac.id/index.php/komputasi/article/view/3507
الاتاحة: https://ejournal.jak-stik.ac.id/index.php/komputasi/article/view/3507
Rights: Copyright (c) 2024 Jurnal Ilmiah Komputasi
رقم الانضمام: edsbas.4014121
قاعدة البيانات: BASE