This study aims to create a model for categorizing pantun types and analyze the accuracy of support vector machines (SVM). The first stage is collecting pantun that have been labeled with pantun category. The pantun categories consist of pantun for children, pantun for young people, and pantun for elder. After collecting data, the next stage is pre-processing. This pre-processing stage makes data ready to be processed on the extraction stage. The pre-processing stage consists of text segmentation, case folding, tokenization, stop word removal, and stemming. The feature extraction stage is intended to analyze potential information and represent terms as a vector. Separating training data and testing data is necessary to be conducted before the classification process. Then the classification process is done by using multiclass SVM. The results of the classification are evaluated to obtain accuracy and will be analyzed whether the classification model is proper to be used. The results showed that SVM classified the types of pantun with accuracy of 81,91%.
Kualitas air yang aman untuk dikonsumsi sangatlah penting bagi kesehatan masyarakat luas di setiap daerah, namun kualitas air diberbagai daerah semakin menurun terutama untuk kebutuhan manusia dalam hal air minum, dampak dari kualitas air yang tidak aman untuk dikonsumsi dapat menyebabkan penyakit seperti kolera, diare, hepatitis A dan lainnya, hal ini dikarenakan air yang memiliki sanitasi yang buruk dan zat-zat yang melebihi kadar standar. Penelitian ini dilakukan untuk mengetahui hasil evaluasi dari model yang dihasilkan untuk dapat memprediksi kualitas air yang dapat dikonsumsi atau tidaknya dengan menerapkan algoritma klasifikasi data mining yaitu adalah algoritma K-Nearest Neighbor. Algoritma ini diterapkan untuk menghitung probabilitas kualitas air yang aman atau tidak untuk dikonsumsi berdasarkan data rekaman yang diambil dari lingkungan sekitar terutama di daerah padat penduduk. Kumpulan data diperoleh dari website kaggle, hasil pemodelan diukur menggunakan tabel Confusion Matrix untuk menghitung akurasi. Setelah diuji, model ini memiliki tingkat akurasi tertinggi 85,52% dengan nilai k (tetangga terdekat) = 3.
Churn merupakan suatu kecenderungan pelanggan untuk berhenti dari suatu produk atau layanan dan kemudian berpindah ke perusahaan lain. Customer churn merupakan masalah yang serius yang harus ditangani untuk keberlangsungan suatu perusahaan. Penanganan customer churn berawal dari ketepatan suatu perusahaan memprediksi customer mana yang diduga akan melakukan churn. Salah satu pendekatan dalam memprediksi customer churn adalah data mining. Penelitian ini membandingkan dua metode klasifikasi dalam data mining yaitu jaringan syaraf tiruan dan pohon keputusan untuk memprediksi customer churn pada industri perbankan. Hasil penelitian menunjukan bahwa jaringan syaraf tiruan memiliki tingkat akurasi lebih baik dibanding pohon keputusan yaitu 86%. Selain itu jaringan syaraf tiruan juga memiliki nilai precision yang lebih baik daripada pohon keputusan, yaitu sebesar 71%. Akan tetapi untuk nilai recall, pohon keputusan memiliki nilai recall lebih baik dibanding dengan jaringan syaraf tiruan yaitu sebesar 58%.
Kegiatan riset ini bertujuan untuk menganalisis animo masyarakat Indonesia khususnya warga Jakarta atas munculnya transportasi massa umum MRT yang di resmikan oleh Pemerintah di bulan Maret 2019. Tahapan penelitian diawali proses crawling tweet dengan menggunakan tweetscrapper dari python. Kemudian dilakukan Preprocessing sehingga didapatkan data tweet yang siap untuk diproses pada pemisahan data yaitu data training dan data testing. Data training dilakukan proses pembobotan dengan TF-IDF, dan proses pembelajaran dengan naive bayes. Proses ini disebut dengan proses training yang bertujuan untuk menghasilkan model klasfikasi. Model klasifikasi digunakan untuk data testing melakukan proses klasifikasi yang menghasilkan label sentimen (positif/negatif). Proses ini dinamakan dengan proses testing. Hasil testing akan dilakukan perhitungan akurasi dari model yang sudah dibuat. Luaran dari penelitian ini berupa analisis sentimen animo warga Jakarta pada media sosial Twitter terhadap kehadiran layanan transportasi publik MRT, dan akurasi yang dihasilkan oleh metode naïve bayes yang diimplementasikan pada analisis sentimen
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.