Abstrak - Facebook memungkinkan penggunanya berinteraksi dengan orang yang kita kenal maupun orang yang tidak kita kenal, dimana hal tersebut dapat membuka peluang bagi kejahatan dunia maya seperti, penculikan, perdagangan manusia (trafficking), hingga pembunuhan. IOM mecatat bahwa korban perdagangan orang atau trafficking di Indonesia mencapai 74.616 hingga I juta per tahun, dimana tindak kejahatan teersebut banyak dilakukan melalui facebook sebagai medianya. Data teks (status) yang berada di halaman facebook sangat besar. Dengan menggunakan Teknik pengolahan data dari ilmu Data Mining, terutama di bidangtext mining, penulis memanfaatkannya untuk mengidentifikasi data teks (status facebook) yang terindikasi sebagai proses kejahatan trafficking dengan memakai salah satu teknik klasifikasi dengan teorema naïve bayes classifier (NBC). Kata kunci : facebook, trafficking, data mining, text mining, klasifikasi, naïve bayes classifier.
Data mining adalah teknik yang memanfaatkan data dalam jumlah yang besar untuk memperoleh informasi berharga yang dapat dimanfaatkan untuk pengambilan keputusan penting. Data kelulusan mahasiswa Universitas Sam Ratulangi menghasilkan data akademik mahasiswa yang berpengaruh pada kualitas perguruan tinggi lewat akreditas yang dilaksanakan oleh Badan Akreditasi Nasional atau BAN-PT. Naïve Bayes merupakan algoritma yang dapat digunakan untuk prediksi masa studi mahasiswa yang bisa dikategorikan tepat waktu, terlambat dan tidak lulus. Dengan menggunakan data mining khususnya klasifikasi untuk prediksi dengan algoritma naïve bayes dapat dilakukan prediksi terhadap ketepatan waktu studi dari mahasiswa berdasarkan data training yang ada.. Pengujian yang dipakai yaitu k-fold cross validation 10-fold. Hasil pengujian didapat nilai akurasi rata-rata sebesar 85.17 % sedangkan nilai akurasi tertinggi sebesar 88.96 %. Kata kunci : Naïve Bayes, K-Fold Cross Validation, Data Mining, Prediksi.
Abstrak
Kata kunci-deteksi intrusi, klasifikasi, preprocessing, support vector machine
Abstract
Intrusion detection system is a system for detecting attacks or intrusions in a network or computer system, generally intrusion detection is done with comparing network traffic pattern with known attack pattern or with finding unnormal pattern of network traffic. The raise of internet activity has increase the number of packet data that must be analyzed for build the attack or normal pattern, this situation led to the possibility that the system can not detect the intrusion with a new
Student feedback is an important evaluation tool for quality improvement. Moreover, in Indonesia's higher education system there is an assessment regulation that puts special attention to the availability of the student feedback system. However, parts of the questionnaire are in the form of descriptive text that requires more effort for analysis. This situation leads to a very tiresome work in case of the number of documents reaches several hundred or even thousands. There were some efforts to apply computer-assisted classification by utilizing machine learning, however, most of them only analyzed English documents. Only a handful that studied the classification of documents in Bahasa Indonesia. In reality, we found some cases where the students used mixed languages while filling the evaluation forms. Therefore, in this study, we expand the application of text classification by using Support Vector Machne (SVM) to cases of student feedback in mixed languages. The model was built computationally and from the test, we get 74% accuracy and 0.46 Kappa value.
Kegiatan menjiplak tugas sering dilakukan mahasiswa yang merupakan tindakan plagiat, banyak tugas yang terkumpul dan waktu yang terbatas membuat dosen sulit untuk memeriksa tugas satu per satu. Oleh karena itu, diperlukan suatu aplikasi yang dapat mendeteksian kemiripan dokumen teks. Penelitian ini menggunakan algoritma Ratcliff/Obershelp yang dapat menilai seberapa mirip pola dari dua string yang berbeda. Pada pengujian algoritma dilakukan pengujian pada 12 dokumen dengan tingkat kesamaan dan posisi yang berbeda. Nilai yang didapat mendekati nilai prediksi dan nilai pada dokumen yang memiliki kesamaan sama tetapi posisi yang berbeda mendapatkan nilai yang berbeda..Kata kunci : Ratcliff/Obershelp, plagiat, Information Retrieval.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.