Skripsi ini berjudul “Syair-syair Wasf (deskripsi) Imru’ al-Qais suatu tinjauan Ilm ‘Aru>d}”, yang membahas tentang tema “Wasf al-Layl (menggambarkan tentang malam), wa al-Faras (menunggang kuda), wa al-S{ayd (binatang buruan)”. Tujuan dari penelitian ini adalah memenggal syair sesuai dengan bah}r yang digunakan sehingga dapat diketahui perubahan wazan pada taf’ilahnya dengan menggunakan pendekatan Ilm al-‘Aru>d}.Penelitian ini menggunakan metode kepustakaan dengan membaca beberapa tiap-tiap bayt syair Imru’ al-Qais. Data yang diperoleh diklasifikasikan dan dianalisis dengan menggunakan metode deskriptif, terhadap pemenggalan syair yang bertema “Wasf al-Layl, wa al-Faras, wa al-S{ayd” sesuai dengan permasalahan data yang diperoleh.Hasil dari penelitian ini menunjukkan bahwa sebahagiaan dari pemenggalan syair yang bertema “Wasf al-Layl, wa al-Faras, wa al-S{ayd” mengalami perubahan wazan pada taf’ilahnya yaitu terjadi ziha}f qabd pada setiap bagian sadr dan ‘ajznya. Jenis al-bayt yang ditemukan yaitu bayt tam yang masih lengkap bagian-bagaiannya maksudnya masih lengkap dengan 8 taf’ilah yang digunakan.
Indonesian General Analysis Dataset is a dataset sourced from social media twitter by using keywords in the form of conjunctions to get a dataset that does not only focus on a particular topic. The use of Indonesian language datasets with general topics can be used to test the accuracy of the classification model so as to provide additional reference in choosing the right methods and parameters for sentiment analysis. One of the algorithms which in several studies produces the highest level of accuracy is naive Bayes which has several variations. This study aims to obtain the method with the best accuracy from the naive Bayes variation by setting the minimum and maximum document frequency parameters on the Indonesian General Analysis Dataset for sentiment analysis. The naive Bayes classifier variations used include Bernoulli naive Bayes, gaussian naive Bayes, complement naive Bayes and multinomial naive Bayes. The research stage begins with downloading the dataset. Preprocessing becomes the next stage which consists of tokenizing, stemming, converting abbreviations and eliminating conjunctions. In the preprocessed data, feature extraction is carried out by converting the dataset into vectors and applying the TF-IDF method before entering the sentiment analysis classification stage. Tests in this study were carried out by applying the minimum document frequency (min-df) and maximum document frequency (max-df) for each variation of naive Bayes to obtain the appropriate parameters. The test uses k-fold cross validation of the dataset to divide the training data and sentiment analysis test data. The next confusion matrix is made to evaluate the level of accuracy.
Pada analisis sentimen pengguna twitter dibutuhkan tahap preprocessing sebelum mengklasifikasikan sentimen. Preprocessing digunakan untuk menyaring kata yang dianggap perlu untuk kebutuhan klasifikasi. Kesalahan penulisan pada tweet merupakan suatu permasalahan dalam tahap preprocessing yang tentunya mempengaruhi tingkat akurasi klasifikasi. Berdasarkan hal tersebut dibutuhkan proses tambahan pada preprocessing untuk melakukan koreksi kesalahan penulisan kata. Pada penelitian ini, penulis membandingkan kinerja metode levenshtein distance dan jaro-winkler distance dalam melakukan koreksi kesalahan penulisan kata. Penelitian ini diawali dengan melakukan survei literatur untuk mengidentifikasi masalah. Selanjutnya melakukan studi pustaka untuk menentukan objek dan parameter yang dibutuhkan dalam merancang dan memodelkan data serta perangkat lunak. Perangkat lunak dikembangkan menggunakan bahasa pemrograman python dengan beberapa library sastrawi, levenshtein, pyjarowinkler dan sklearn. Perangkat lunak ini dibangun untuk memudahkan dalam melihat kinerja metode yang digunakan. Pengujian dilakukan menggunakan confusion matrix dengan 10 fold cross validation. Pengujian melibatkan pengukuran kinerja levenshtein distance jika ditempatkan sebelum dan sesudah proses stemming. Begitupula untuk metode jaro-winkler distance juga ditempatkan sebelum dan sesudah proses stemming dalam preprocessing. Dari hasil pengujian diperoleh nilai accuracy, recall dan f1score dari metode levenshtein distance lebih baik dibandingkan jaro-winkler distance. Penerapan koreksi kata dengan metode levenshtein distance juga meningkatkan accuracy, recall dan f1score jika dibandingkan tanpa koreksi kata pada preprocessing. Penempatan koreksi kata pada tahap preprocessing dari hasil pengujian menunjukan posisi setelah proses stemming lebih baik dari penempatan koreksi kata sebelum proses stemming
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.