Predicting rainfall needs to be done as one of such effort to anticipate water flooding. One of the algorithm that can be used to predict rainfall is random forest. The porpose of the research is to create a model by implementing random forest algorithm. The research method consist of four steps: data collection, data processing, random forest implementation, analysis. Random forest implementation with using training set resulted model that has accurracy 71,09%, precision 0.75, recall 0.85, f-measure 0.79, kappa statistic 0.33, MAE 0.35, RMSE 0.46, ROC Area 0.78. Implementation of random forest algorithm with 10-fold cross validation resulted the output with accurracy 99.45%, precision 0.99, recall 0.99, f-measure 0.99, kappa statistic 0.99, MAE 0,09, RMSE 0.14, ROC area 1.
Abstrack -Tuberculosis is a health problem that is transmitted through the air due to the presence of the mycobacterium tuberculosis. Tuberculosis cases were spread almost throughout Karawang Regency. The area of Karawang Regency and the number of cases that tends to increase every yaer, allows the need for clustering areas of the tuberculosis spreads. The method that can be used to clustering the areas where tuberculosis is spreading is data mining. The data mining methodology applied is CRISP-DM. The dataset used comes from the Karawang District Health Office in 2018. Then the data is processed using the k-means clustering algorithm with the help of WEKA tools. The study begins by finding the best number of clusters using the elbow method, where K=3 is the best number of clusters. K=3 combined with S (random seed) 5, 10, 15 to be tested. The results of these testing then evaluated using SSE (Sum of Square Error). The best clustering is produced by K=3 with a combination of S=10 which consists of cluster 0 (7 members), cluster 1 (9 members), and cluster 2 (14 members). Evaluation values generated by SSE 2,4402 and Silhouette 0,5629.
Clickbait menjadi salah satu cara untuk mencari uang dengan meningkatkan traffic pengunjung dan pengunjung. Praktik clickbait pada saat ini sudah merambah pada dunia jurnalistik sedangkan sistem berita media online berbeda dengan media cetak. Sama halnya dengan media online lainnya, clickbait ini memberikan pengaruh besar terhadap penyedia berita karena rasa keingintahuan dari para pembaca dan sulitnya para pembaca memilih berita clickbait atau bukan clickbait. Praktik clickbait ini sendiri sangat di andalkan oleh penyedia situs berita yang menggunakan judul-judul yang menjebak untuk menarik para pembaca. Berdasarkan masalah tersebut dilakukan penelitian untuk mengklasifikasikan berita clickbait menggunakan metode K-Nearest Neighbors (K-NN).Dari hasil penelitian yang dilakukan, diperoleh hasil terbaik pada jumlah k = 11 dengan menggunakan skenario 1 pada data pembagian dengan jumlah data sebanyak 800 data dan 200 data uji yang menghasilkan akurasi sebesar 71%, ketepatan 72%, dan ingat 71%. Hal ini menunjukkan bahwa klasifikasi berita clickbait dapat di klasifikasikan menggunakan K-Nearest Neighbor.
Gastritis atau penyakit maag merupakan proses inflamasi atau gangguan kesehatan yang disebabkan oleh faktor iritasi dan infeksi pada mukosa dan submukosa lambung. Penyakit maag jika dibiarkan terus menerus akan merusak fungsi lambung serta dapat meningkatkan resiko kematian. Penyakit maag merupakan salah satu penyakit dengan kasus tinggi yang ada di Kabupaten Karawang. Tujuan penelitian ini yaitu untuk mengelompokkan daerah yang memiliki penyakit maag dengan tingkat tinggi dan rendah di Kabupaten. Clustering dapat dijadikan solusi untuk mengelompokkan daerah dengan tingkat penyakit maag tinggi atau rendah di Kabupaten Karawang. Algoritma yang digunakan yaitu KMedoids dengan pengukuran Euclidean Distance sehingga hasil yang didapatkan pada dataset Penyakit Maag Kabupaten Karawang Tahun 2017-2019 memiliki cluster optimal sebanyak 2 cluster, dimana cluster 1 dengan 35 daerah dan dikategorikan rendah, dan pada cluster 2 dengan 15 daerah yang dikategorikan tinggi, dan menghasilkan nilai Silhouette Coefficient sebesar 0,5561.
PT.Astra International Tbk – Isuzu adalah perusahaan yang bergerak dalam bidang otomotif khususnya adalah mobil. Penjualan PT.Astra International Tbk – Isuzu setiap tahunnya mengalami perubahan yang tidak menentu, hal tersebut dapat mempengaruhi jumlah produksi. Dari permasalahan tersebut, maka perlu adanya Estimasi dalam jumlah produksi setiap tahunnya agar tidak terjadi produksi yang berlebihan. Penelitian ini menggunakan Algoritma Regresi Linear Berganda dengan menerapkan metode Cross Industry Standard Process for Data mining (CRISP-DM), Algoritma Regresi Linear Berganda bertujuan untuk mencari nilai persamaan regresi dengan menggunakan tools SPSS24. Setelah mendapatkan persamaan regresi tersebut dilakukan perhitungan secara manual untuk menemukan estimasi penjualan PT.Astra International Tbk – Isuzu pada tahun 2020, pada penelitian digunakan 2 variabel independen yaitu cabang (X1) dan type (X2) dan 1 variabel dependen yaitu Penjualan (Y). Berdasarkan perhitungan Algoritma Regresi Linear Berganda menggunakan tools SPSS24 ditemukan hasil nilai FHitung sebesar 48,657 dengan nilai signifikansi 0,000 yang berarti bahwa variabel X1 dan X2 mempengaruhi dari vairabel Y dengan nilai R2=74,7% dan nilai MAD=0,0607 Hasil penelitian ini mendapatkan estimasi penjualan PT.Astra International Tbk – Isuzu tahun 2020 sebanyak 12.223, penelitian ini juga dapat digunakan sebagai acuan perusahaan agar dapat mengestimasi berapa jumlah yang akan di produksi.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.