Diabetes menjadi salah satu penyakit yang mematikan di dunia, termasuk di Indonesia. Diabetes dapat menyebabkan komplikasi di banyak bagian tubuh dan secara keseluruhan dapat meningkatkan risiko kematian. Salah satu cara untuk mendeteksi penyakit diabetes adalah dengan memanfaatkan algoritma machine learning. Logistic regression merupakan model klasifikasi dalam machine learning yang banyak digunakan dalam analisis klinis. Pada makalah ini, dirancang model prediksi menggunakan logistic regression pada Python IDE untuk deteksi dini dengan memberikan prediksi seseorang terindikasi penyakit diabetes atau tidak berdasarkan data awal yang diberikan. Eksperimen dilakukan menggunakan dataset dari Pima Indians Diabetes Database yang terdiri atas 768 data pasien dengan delapan variabel independen dan satu variabel dependen. Exploratory data analysis dilakukan untuk mendapatkan wawasan maksimal dari dataset yang dimiliki menggunakan bantuan statistik dan mempresentasikannya melalui teknik visual. Beberapa variabel dataset memuat data yang tidak lengkap. Nilai data yang hilang digantikan dengan nilai median dari setiap variabel. Penanganan terhadap data yang tidak seimbang dilakukan menggunakan synthetic minority over-sampling technique (SMOTE) untuk meningkatkan kelas minoritas melalui sampel data sintesis. Model dievaluasi berdasarkan confusion matrix yang memperlihatkan kinerja yang cukup baik dengan nilai akurasi sebesar 77%, presisi 75%, recall 77% dan F1-score 76%. Selain itu, pada makalah ini juga digunakan teknik grid search sebagai hyperparameter tuning yang dapat meningkatkan kinerja dari model logistic regression. Kinerja model dasar dengan model sesudah dilakukan penerapan teknik grid search diuji dan dievaluasi. Hasil percobaan memperlihatkan bahwa model berbasis hyperparameter tuning mampu meningkatkan kinerja algoritma logistic regression untuk prediksi dengan nilai akurasi sebesar 82%, presisi 81%, recall 79%, dan F1-score 80%.
Dalam aplikasi machine learning sangat umum ditemukan kumpulan data dalam berbagai tingkat ketidakseimbangan mulai dari ketidakseimbangan kecil, sedang sampai ekstrim. Sebagian besar model machine learning yang dilatih pada data tidak seimbang akan memiliki bias dengan memberikan tingkat akurasi yang tinggi pada kelas mayoritas dan sebaliknya rendah pada kelas minoritas. Tujuan penelitian ini adalah untuk mengevaluasi dampak dari SMOTE (Synthetic Minority Oversampling Technique) pada pengklasifikasi Random Forest untuk memprediksi penyakit jantung. Data berjumlah 299 berasal dari UCI Machine learning Repository digunakan untuk membangun model prediksi berdasarkan 12 variabel independen dan 1 variabel dependen. Kelas minoritas dalam dataset pelatihan di oversampling menggunakan teknik SMOTE (Synthetic Minority Oversampling Technique). Model dievaluasi tidak hanya menggunakan ukuran kinerja Accuracy dan Precision saja, namun juga menggunakan alternatif ukuran kinerja lainnya seperti Sensitivity, F1-score, Specificity, G-Mean dan Youdens Index yang lebih baik digunakan untuk data yang tidak seimbang. Hasil penelitian menunjukkan bahwa teknik SMOTE (Synthetic Minority Oversampling Technique) mampu mengurangi overfitting sekaligus meningkatkan kinerja model Random Forest pada semua indikator. Peningkatan skor Accuracy sebesar 3.45%, Precision 4.8%, Sensitivity 7.1%, F1-score 4.8%, Specificity 2.1%, G-Mean 4.4%, dan Youdens Index 6.3%. Penelitian ini membuktikan bahwa dalam menentukan pengklasifikasi dengan algoritma machine learning seperti Random Forest, kemiringan kelas dalam data perlu diperhitungkan dan diseimbangkan untuk hasil kinerja yang lebih baik.
Guru bimbingan konseling (BK) memiliki tugas untuk membantu agar peserta didik dapat berkembang secara mandiri, dan membantu peserta didik tersebut menyelesaikan masalah yang sedang dihadapi baik dibidang akademik maupun non akademik. Akan tetapi permasalahan peserta didik tersebut tidak semuanya dapat diselesaikan dengan baik oleh guru bimbingan konseling karena beragamnya masalah yang ditangani. Selanjutnya berbagai solusi yang diberikan juga tidak didasari pada pendekatan penyelesaian masalah berdasarkan karakter peserta didik karena sulitnya membaca karakter peserta didik tersebut. Sebuah aplikasi untuk menentukan karakter peserta didik secara otomatis dirancang dengan menggunakan teori Myers Briggs Type Indicator. Teori Myers Briggs Type Indicator adalah psikotest yang dirancang untuk mengukur preferensi seseorang dalam melihat dunia dan mengambil suatu keputusan. Aplikasi ini dapat digunakan oleh guru bimbingan konseling sebagai alat bantu dalam memberikan layanan bimbingan kepada peserta didik sehingga bisa memberikan solusi yang terbaik terhadap masalah yang ditangani oleh guru BK berdasarkan pendekatan karakter peserta didik.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.