The occurrence of imbalanced class in a dataset causes the classification results to tend to the class with the largest amount of data (majority class). A sampling method is needed to balance the minority class (positive class) so that the class distribution becomes balanced and leading to better classification results. This study was conducted to overcome imbalanced class problems on the Indian Pima diabetes illness dataset using k-means-SMOTE. The dataset has 268 instances of the positive class (minority class) and 500 instances of the negative class (majority class). The classification was done by comparing C4.5, SVM, and naïve Bayes while implementing k-means-SMOTE in data sampling. Using k-means-SMOTE, the SVM classification method has the highest accuracy and sensitivity of 82 % and 77 % respectively, while the naive Bayes method produces the highest specificity of 89 %.
Penyakit diabetes merupakan salah satu penyakit paling banyak diderita oleh manusia seluruh dunia. Setiap tahun terjadi peningkatan kematian yang disebabkan oleh penyakit diabetes. Penyakit diabetes terjadi disebabkan oleh tubuh tidak menghasilkan insulin dalam jumlah yang cukup. Salah satu cara yang digunakan untuk mengurangi jumlah kematian yang disebabkan oleh penyakit diabetes adalah melakukan diagnosis secara dini. Salah satu teknik yang bisa digunakan adalah memanfaatkan teknik data mining. Untuk melakukan diagnosis penyakit diabetes dibutuhkan suatu metode yang memiliki akurasi terbaik. Pada penelitian ini melakukan komparasi metode Correlated-Naive Bayes Classifier dan Naive Bayes Classifier untuk mendapatkan akurasi terbaik sehingga dapat digunakan untuk diagnosis penyakit diabetes. Berdasarkan pengujian yang telah dilakukan menunjukkan bahwa metode Correlated Naive Bayes Classifier (CNBC) memperoleh akurasi terbaik dibandingkan dengan metode Naive Bayes Classifier (NBC) untuk Dataset Pima indian Diabetes. Tingkat akurasi metode Correlated Naive Bayes Classifier (CNBC) sebesar 67,15%, sedangkan metode Naive Bayes Classifier (NBC) sebesar 64,33%. Metode Correlated Naive Bayes Classifier (C-NBC) memiliki akurasi lebih tinggi dibandingkan metode Naïve Bayes Classifier (NBC) karena pada metode Correlated Naïve Bayes Classifier memperhitungkan nilai korelasi dari masing-masing atribut dataset terhadap Kelasnya. Dengan demikian penggunaan metode Correlated Naïve Bayes Classifier (C-NBC) dapat digunakan untuk melakukan diagnosis penyakit diabetes karena memiliki tingkat akurasi yang bagus dibandigkan metode Naive Bayes Classifier.
Bumigora University College there are several things that are not balanced between the entry and exit of students who have completed their studies. Students who enter in large numbers, but students who graduate on time below the specified standards. As result, there was a huge accumulation of students in each graduation period. One solution to overcome the problem above needs a data mining based system in monitoring or utilizing student development in predicting graduation using the C4.5 algorithm. The stages of this research began with problem analysis, data collection, data requirement analysis, data design, coding, and testing. The results of this study are the implementation of the C4.5 algorithm for predicting student graduation on time or not. The data used is the data of students who have graduated from 2010 to 2012. The level of acceptance generated using the confusion matrix is 93,103% accuracy using 163 training data and 29 testing data or 85% training data and 15% testing data. The results of research and testing that has been done, C4.5 algorithm is very suitable to be used in student graduation prediction.
Aplikasi Pemetaan Kualitas Pendidikan Di Indonesia Menggunakan Metode K-Means adalah sebuah aplikasi yang dirancang untuk memudahkan pemetaan kualitas pendidikan di Indonesia. Aplikasi ini dapat membuat sebuah cluster dari kualitas pendidikan di Indonesia berdasarkan sejumlah parameter yaitu Angka Partisipasi Kasar, Angka Partisipasi Murni, Angka Putus Sekolah, Angka Kelulusan, Angka Melanjutkan, Jumlah Sekolah, Rasio Siswa/Sekolah, Rasio Siswa/Kelas, Rasio Kelas/Guru, Rasio Kelas/Sekolah, Rombongan Belajar/Ruang Kelas, dan Jarak Sekolah. Keluaran atau output dari sistem berupa peta yang mengelompokkan daerah-daerah sesuai dengan kualitas pendidikan yang dimilikinya. Analisis perancangan yang digunakan dalam pembuatan sistem ini menggunakan UML (Unified Modeling Language) dimana setiap aktivitas pada sistem akan dikelompokkan secara sendiri-sendiri di dalam sebuah use case diagram dan alur dari sistem digambarkan dalam bentuk flowchart. Perancangan sistem yang dilakukan antara lain perancangan basis data. Perancangan berdasarkan spesifikasi kebutuhan, dan perancangan antarmuka. Secara umum aplikasi ini dapat menghitung data parameter kualitas pendidikan dengan menggunakan metode K-Means Clustering, dan menampilkan hasilnya dalam bentuk peta, sehingga dinas pendidikan atau lembaga-lembaga yang menangani pendidikan di Indonesia dapat membandingkan kualitas pendidikan setiap provinsi di Indonesia Key word : Clustering, k-means, pemetaan
Penelitian ini bertujuan untuk mengetahui pengaruh PAD dan DAU terhadap Belanja Modal di Pemerintah daerah Kabupaten/kota di Sumatera Selatan. Penelitian ini menggunakan jenis penelitian assosiatif. Teknik pengumpulan data yang digunakan dalam penelitian ini adalah teknik dokumentasi. Teknik analisis data yang digunakan yaitu analisis kuantitatif. Tehnik analisis data menggunakan regresi linear berganda dengan bantuan SPSS. Hasil penelitian menunjukkan bahwa PAD dan DAU berpengaruh secara bersama dan parsial terhadap Belanja Modal.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.