2023
DOI: 10.35970/infotekmesin.v14i1.1751
|View full text |Cite
|
Sign up to set email alerts
|

Penerapan Data Mining dalam Analisis Prediksi Kanker Paru Menggunakan Algoritma Random Forest

Abstract: Cancer is the second highest cause of death in the world. In Indonesia, it is a disease with a high mortality rate. Most patients do not realize that they have lung cancer thus the treatment is sometimes too late. A prediction method with a high degree of accuracy is needed to detect lung cancer earlier. Previous research used data mining calcification methods with the Naïve Bayes algorithm to predict lung cancer. This research resulted in high recall values for the positive class (Yes class) but low for the n… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
0
0

Year Published

2023
2023
2023
2023

Publication Types

Select...
3

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(5 citation statements)
references
References 12 publications
0
0
0
Order By: Relevance
“…where False Negative (FN), False Positive (FP), True Negative (TN), dan True Positive (TP) [16]. Accuracy is the ratio of correct predictions for all data.…”
Section: Discussionmentioning
confidence: 99%
See 1 more Smart Citation
“…where False Negative (FN), False Positive (FP), True Negative (TN), dan True Positive (TP) [16]. Accuracy is the ratio of correct predictions for all data.…”
Section: Discussionmentioning
confidence: 99%
“…The data is divided into k parts and each part will be a data set in turn. So that every data has a chance into train and test data [16].…”
Section: Modellingmentioning
confidence: 99%
“…Gambar 2 (a) menunjukkan bahwa variabel respon (Y) tidak seimbang sehingga dapat menyebabkan bias pada kelas mayoritas dan berpengaruh terhadap proses klasifikasi [23]. Oleh sebab itu setelah dilakukan pembagian data menjadi data latih dan data uji, perlu dilakukan penyeimbangan pada data latih.…”
Section: Pengujian Dan Analisisunclassified
“…Teknik Random Over Sampling merupakan teknik penanganan data tidak seimbang dengan membuat data buatan dari data minoritas sebanyak data mayoritas [24]. Teknik SMOTE merupakan teknik penanganan data tidak seimbang yang mirip dengan teknik oversampling namun teknik ini akan membuat kelas minoritas lebih beragam dengan sampel baru yang mirip dengan data asli kelas minoritas [23]. Berdasarkan F1 score, ketiga model tersebut memiliki nilai mendekati 0 yang artinya ketiga model tersebut mungkin memiliki masalah serius dalam mengklasifikasikan Kelas 1 (ada KLB diare).…”
Section: Pengujian Dan Analisisunclassified
“…Data Mining adalah metode untuk menyusun pengetahuan dengan menggunakan algoritma untuk menemukan pola, tren, dan prinsip mekanis tertentu dalam data. Teknik ini digunakan untuk menentukan hubungan antara data yang sebelumnya tidak terlihat [5].…”
Section: Pendahuluanunclassified