2020
DOI: 10.22146/ijccs.37415
|View full text |Cite
|
Sign up to set email alerts
|

Oversampling Method To Handling Imbalanced Datasets Problem In Binary Logistic Regression Algorithm

Abstract: The class imbalance is a condition when one class has a higher percentage than the other then it can affect the accuracy. One method in data mining that can be used to classification is logistic regression method. The method used in this research is RWO-sampling method using random replicate approach for synthetic data generation on descrete attribute. The result of the research can handle the problem of class imbalance, RWO-sampling method with random replicate approach shows better accuracy than RWO-sampling… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
2
0
5

Year Published

2021
2021
2023
2023

Publication Types

Select...
5
2

Relationship

0
7

Authors

Journals

citations
Cited by 8 publications
(7 citation statements)
references
References 7 publications
0
2
0
5
Order By: Relevance
“…Hasil penelitian ini, metode RWO-sampling dengan pendekatan H a l a m a n | 33 replikasi secara random menunjukkan akurasi yang lebih baik dibandingkan dengan metode RWOsampling dengan pendekatan roulette dan ROS. Untuk pengujian masalah underfitting dalam regresi logistik menunjukkan bahwa metode oversampling lebih baik daripada non-oversampling dengan kenaikan nilai akurasi mencapai rata-rata 2,3% dari setiap data set (Ustyannie & Suprapto, 2020).…”
Section: Penelitian Terdahuluunclassified
“…Hasil penelitian ini, metode RWO-sampling dengan pendekatan H a l a m a n | 33 replikasi secara random menunjukkan akurasi yang lebih baik dibandingkan dengan metode RWOsampling dengan pendekatan roulette dan ROS. Untuk pengujian masalah underfitting dalam regresi logistik menunjukkan bahwa metode oversampling lebih baik daripada non-oversampling dengan kenaikan nilai akurasi mencapai rata-rata 2,3% dari setiap data set (Ustyannie & Suprapto, 2020).…”
Section: Penelitian Terdahuluunclassified
“…Scenario 3 is testing the model using a training and validation data with oversampling technique, by generalizing the amount of data in each class based on the data in the most populated class . The assumption is that rather than discarding important data, it is better to duplicate the data in the least class to balance the amount of data in the most class [15]. So based on Table 4, the most populated class is the Cyber Physical System class with 459 rows, by applying the oversampling technique it produced a total of 1836 rows with 459 rows in each class.…”
Section: ๐‘ƒ๐‘Ÿ๐‘’๐‘๐‘–๐‘ ๐‘–๐‘œ๐‘› = ๐‘‡๐‘ƒ ๐‘‡๐‘ƒ + ๐น๐‘ƒmentioning
confidence: 99%
“…Klasifikasi merupakan sebuah proses untuk menemukan sebuah model yang menjelaskan dan membedakan konsep atau kelas data dengan tujuan memperkirakan kelas dari suatu objek yang kelasnya tidak diketahui (Tan et al, 2006). Naive Bayes merupakan metode klasifikasi yang sering digunakan karena proses algoritmanya yang lebih cepat dan mudah serta robust terhadap data pencilan (Prasetyo, 2012).…”
Section: Pendahuluanunclassified
“…Algoritma Naive Bayes berakar pada teorema Bayes. Teorema Bayes merupakan teorema yang mengacu pada konsep probabilitas bersyarat (Tan et al, 2006). Metode ini merupakan pendekatan statistik untuk melakukan inferensi induksi pada persoalan klasifikasi.…”
Section: Naive Bayesunclassified