Abstrack -Tuberculosis is a health problem that is transmitted through the air due to the presence of the mycobacterium tuberculosis. Tuberculosis cases were spread almost throughout Karawang Regency. The area of Karawang Regency and the number of cases that tends to increase every yaer, allows the need for clustering areas of the tuberculosis spreads. The method that can be used to clustering the areas where tuberculosis is spreading is data mining. The data mining methodology applied is CRISP-DM. The dataset used comes from the Karawang District Health Office in 2018. Then the data is processed using the k-means clustering algorithm with the help of WEKA tools. The study begins by finding the best number of clusters using the elbow method, where K=3 is the best number of clusters. K=3 combined with S (random seed) 5, 10, 15 to be tested. The results of these testing then evaluated using SSE (Sum of Square Error). The best clustering is produced by K=3 with a combination of S=10 which consists of cluster 0 (7 members), cluster 1 (9 members), and cluster 2 (14 members). Evaluation values generated by SSE 2,4402 and Silhouette 0,5629.
Di Indonesia buah mangga merupakan tanaman yang tumbuh subur. Namun pemilihan jenis mangga sendiri masih dilakukan secara manual yakni memilah jenis mangga dengan membanding warna, bentuk dan ukuran. Salah satu perkembangan teknologi pada bidang perindustrian yakni jaringan syaraf tiruan yang mampu belajar sendiri layaknya manusia. Dalam penelitian ini dibuat sebuah sistem yang mampu mengklasifikasi jenis-jenis mangga. Sistem yang akan dibangun ini menerapkan jaringan syaraf tiruan untuk pemodelannya dan menggunakan ekstraksi ciri berupa mean RGB dan standar deviasi RGB, perimeter, luas, panjang, lebar, kebulatan, dan kerampingan. Pada proses percobaan klasifikasi jenis buah mangga digunakan jaringan syaraf tiruan propagasi balik (backpropagation) dengan melakukan variasi 2 model, yakni traingdx dan trainlm dan fungsi transfer layer logsig dan fungsi transfer output purelin. Model pengujian yang digunakan pada proses klasifikasi adalah k-fold cross validation dengan dasar variasi epoch, goal, dan learning rate dari pengujian menggunakan holdout validation. Berdasarkan hasil percobaan, didapat akurasi terbaik dengan 1 hidden layer sebesar 100% dengan waktu 10,45 detik kemudian pengujian k-fold menghasilkan rata-rata akurasi tertinggi 95,31% dengan rata-rata waktu 0,06 detik.
PT.Astra International Tbk – Isuzu adalah perusahaan yang bergerak dalam bidang otomotif khususnya adalah mobil. Penjualan PT.Astra International Tbk – Isuzu setiap tahunnya mengalami perubahan yang tidak menentu, hal tersebut dapat mempengaruhi jumlah produksi. Dari permasalahan tersebut, maka perlu adanya Estimasi dalam jumlah produksi setiap tahunnya agar tidak terjadi produksi yang berlebihan. Penelitian ini menggunakan Algoritma Regresi Linear Berganda dengan menerapkan metode Cross Industry Standard Process for Data mining (CRISP-DM), Algoritma Regresi Linear Berganda bertujuan untuk mencari nilai persamaan regresi dengan menggunakan tools SPSS24. Setelah mendapatkan persamaan regresi tersebut dilakukan perhitungan secara manual untuk menemukan estimasi penjualan PT.Astra International Tbk – Isuzu pada tahun 2020, pada penelitian digunakan 2 variabel independen yaitu cabang (X1) dan type (X2) dan 1 variabel dependen yaitu Penjualan (Y). Berdasarkan perhitungan Algoritma Regresi Linear Berganda menggunakan tools SPSS24 ditemukan hasil nilai FHitung sebesar 48,657 dengan nilai signifikansi 0,000 yang berarti bahwa variabel X1 dan X2 mempengaruhi dari vairabel Y dengan nilai R2=74,7% dan nilai MAD=0,0607 Hasil penelitian ini mendapatkan estimasi penjualan PT.Astra International Tbk – Isuzu tahun 2020 sebanyak 12.223, penelitian ini juga dapat digunakan sebagai acuan perusahaan agar dapat mengestimasi berapa jumlah yang akan di produksi.
<p><em>Abstract</em></p><p><em>Tracking college </em><em>graduates</em><em> needs to be done to find out how their current job status is, especially the waiting time to get a job, as an indicator of the quality of college graduates. Information technology support such as data mining can be used as tools to generate knowledge. This study aims to predict the waiting time for alumni to get a job using a single decision tree algorithm (C4.5) and compare the decision tree algorithm (C4.5) with the forward selection feature. Data processing uses the C4.5 algorithm with the help of RapidMiner Studio software. The results show that the decision tree algorithm (C4.5) with the forward selection feature achieves the best performance with 80.37% accuracy, 79.56% precision, 81.34% recall, 80.40% f-measure and 0.914 AUC which includes into the excellent classification category. Thus, the C4.5 algorithm based on Forward Selection is proven to increase the level of accuracy, compared to a single decision tree (C4.5) algorithm, which is characterized by an increase in the accuracy value of 25.93%.</em></p><p><em>Keywords: Data Mining, Decision Tree, C4.5, Classification, </em><em>Graduates </em><em>Waiting Time</em></p><p> </p><p><em>Abstrak</em></p><p><em>P</em><em>elacakan </em><em>alumni perguruan tinggi </em><em>perlu dilakukan untuk mengetahui bagaimana status pekerjaan </em><em>mereka</em><em> saat ini</em><em>, khususnya waktu tunggu dalam mendapatkan pekerjaan, sebagai salah indikator kualitas lulusan perguruan tinggi</em><em>. </em><em>Dukungan teknologi informasi seperti </em><em>data mining </em><em>dapat digunakan sebagai tools </em><em>untuk menghasilkan suatu pengetahuan. Penelitian ini </em><em> </em><em>bertujuan untuk memprediksi waktu tunggu alumni mendapatkan pekerjaannya dengan menggunakan algoritma decision tree (C4.5) tunggal dan dibandingkan algoritma decision tree (C4.5) dengan fitur forward selection. </em><em>Pengolahan data menggunakan algoritma C4.5 dengan bantuan software RapidMiner Studio. </em><em>Hasilnya menunjukkan bahwa algoritma decision tree (C4.5) dengan fitur forward selection meraih performa terbaik dengan nilai accuracy 80,37%, precision 79,56%, recall 81,34%, f-measure 80,40% dan AUC 0.914 yang termasuk ke dalam kategori excellent classification.</em><em> </em><em>Dengan demikian,</em><em> algoritma C4.5 berbasis Forward Selection terbukti dapat meningkatkan tingkat akurasi, dibandingkan dengan algoritma decision tree (C4.5) tunggal, yang ditandai dengan peningkatan nilai akurasi sebesar 25,93%</em></p><p><strong><em>Kata </em></strong><strong><em>k</em></strong><strong><em>unci: </em></strong><em>Data Mining, Decision Tree, C4.5, Klasifikasi, Waktu Tunggu</em><em> Alumni</em><em> </em></p>
KAOCHEM Sinergi Mandiri Cooperative is a cooperative that provides various kinds of basic needs such as basic foodstuffs that can meet the needs of its members. The cooperative transaction data is only stored as a report. Association rules are a method in data mining that functions to identify items that have a value that is likely to appear simultaneously with other items. One implementation of the association method is Market Basket Analysis. The data used are transaction data for November 2019. Data mining is one of the processes or stages of the KDD method. The data mining process is carried out using the FP-Growth algorithm, which is one of the algorithms for calculating the sets that often appear from data. Researchers analyzed transaction data using the Rapid Miner Studio tools. In the data mining process using FP-Growth the researcher determines a minimum support value of 3% and a minimum confidence of 50%. The association process using these values produces 3 strong rules, namely if ades 350 ml, then fried / lontong with a support value of 0.030 and confidence 0.556 and if fried st, then fried / lontong with a support value of 0.048 and confidence 0.639, and if nasi uduk / bacang , then fried / rice cake with a support value of 0.031 and confidence 0.824. The results of the association rules can be applied using one of the marketing techniques, namely cross-selling to increase the sales of the cooperative.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.