Kebijakan melakukan vaksinasi ini hadir sebagai upaya pemerintah dalam merespon wabah penyakit menular Covid-19, tentu dalam suatu kebijakan tidak terlepas dari dukungan maupun kontra. Berbagai komentar ini muncul dari masyarakat baik berupa opini atau fakta pengalaman yang mereka alami, ratusan bahkan ribuan komentar ini dapat menjadi data yang berharga untuk dijadikan bahan analisis dan mengetahui reaksi masyarakat ketika kebijakan vaksinasi Covid-19 ini diterapkan ke masyarakat, data komentar ini dapat diproses untuk mendapatkan informasi, salah satu analisis pendapat atau review dapat dilakukan adalah menggunakan analisis sentimen. Berdasarkan uraian diatas, dapat memanfaatkan pembelajaran mesin menggunakan algoritma Logistic Regression untuk membantu dalam mengolah data informasi tersebut, dalam hal ini klasifikasi. Hasil pengujian menunjukan tingkat akurasi mencapai 82% terhadap data dev akan tetapi tidak diikuti oleh nilai F1-Score yang cukup baik untuk membangun sebuah model, hal ini disebabkan oleh data train memiliki distribusi klasifikasi yang tak seimbang. Maka dilakukan proses Slicing data serta Tuning Hyperparameters yang bertujuan untuk mendapatkan model terbaik, setelah menerapkan model terbaik yang didapat dari data dev maka dilakukan pengujian terhadap data test, metode Logistic Regression menghasilkan nilai akurasi 67% dan F1-score 60% terhadap data test hasil ini membuktikan bahwa model yang dibangun cukup handal dalam melakukan klasifkasi, terbukti nilai f1-score dan akurasi cukup berimbang dan lebih baik dari Naïve Bayes, SVM dan LSTM.
Kebakaran hutan dan lahan merupakan salah satu masalah lingkungan dalam hal ekonomis dan ekologis yang merugikan. Jumlah hotspot kebakaran hutan di Provinsi Riau telah meningkat secara dramatis menyebabkan kabut asap yang berbahaya. Penelitian ini bertujuan untuk mengklasifikasi kebakaran hutan dan lahan di Kabupaten Pelalawan, Riau. Penelitian ini telah menggunakan 792 data dalam lima tahun (2015-2019). Model klasifikasi kebakaran hutan menggunakan algoritma Naïve Bayes. Atribut yang digunakan untuk klasifikasi terdiri dari suhu, kelembaban, curah hujan, kecepatan angin, dan kelas dari keempat faktor tersebut didapatkan hasil probabilitas tertinggi yaitu suhu dengan nilai 0.978260870 dan nilai akurasi tertinggi adalah dataset tahun 2017 dengan nilai akurasi adalah 81.03% sehingga nilai akurasi tertinggi tersebut dapat diterapkan pada dataset baru yaitu pada tahun 2019 dengan nilai akurasinya adalah 82%. Dengan demikian, dapat disimpulkan bahwa model klasifikasi menggunakan Naïve Bayes memiliki potensi untuk digunakan secara efektif sehingga dapat membantu pihak berwenang dalam mencegah kebakaran hutan dan lahan.
The implementation of the Covid-19 vaccination carried out by Indonesian government was ignited pros and contras among the public. Certainly, there will be pros and cons about the vaccination from the community. This attituded of pros and cons, which is also called sentiment, can influence people to accept or refuse to be vaccinated. Todays, people express their sentiment in social media in comments, post, or status. One of the methods used to detect sentiment on social media, whether positive or negative, is through a categorisation of text approach. This research provides a deep learning technique for sentiment classification on Twitter that uses Long Short Term Memory (LSTM), for positive, neutral and negative classes. The word2vec word embeddings was used as input, using the pretrained Bahasa Indonesia model from Wikipedia corpus. On the other hand, the topic-based word2vec model was also trained from the Covid-19 vaccination sentiment dataset which collected from Twitter. The data used after balanced is 2564 training data, 778 data validation data, and 400 test data with 1802 neutral data, 1066 negative data, and 566 positive data. The best results from various parameter processes give an F1-Score value of 54% on the test data, with an accuracy of 66%. The result of this research is a model that can classify sentiments with new sentences.
Abstrak - Instagram memiliki berbagai macam pengguna tanpa terkecuali pemerintah, akun instagram pemerintah sendiri memiliki fungsi sebagai salah satu media informasi bagi masyarakat untuk mengetahui berita terbaru. Pemerintah telah melakukan berbagai upaya untuk mengurangi dan memutus rantai penyebaran virus covid-19, salah satu langkah yang diambil pemerintah dalam menghadapi covid-19 dengan menerapkan kebijakan New Normal. Tujuan penulis dari penelitian ini adalah untuk menghitung akurasi metode K-Nearest Neighbor pada klasifikasikan sentimen dari opini masyarakat terkait penerapan kebijakan new normal. Penelitian ini dilakukan melalui beberapa tahapan yaitu pengumpulan data dari akun yang dikelola pemerintah. Setelah itudata tersebut dilakukan proses preprocessing. Lalu membuat model dengan menggunakan word embedding FastText. Selanjutnya menggunakan feature engineering dalam melakukan improve untuk menghasilkan fitur terbaik. Dataset dalam penelitian ini berjumlah 4717 data yang terbagi dari 1456 data kelas pro, 1662 data kelas netral, 1599 data kelas kontra. Pengujian yang dilakukan menggunakan confusion matrix dengan cara menguji data latih dan data uji sebanyak 3 kali dengan perbandingan data 90:10 yaitu nilai akurasi sebesar 60,169% dan pada k-40 dengan perbandingan 80:20 yaitu nilai akurasi 60,16%, sedangkan akurasi terendah terdapat pada perbandingan data 70:30 yaitu 58,12%.Kata kunci: New Normal, Instagram, Klasifikasi, Sentimen, K-Nearest Neighbor Abstract - Instagram has various kinds of users without the exception of the government, the government's own Instagram account has a function as a medium of information for the public to find out the latest news. The government has made various efforts to reduce and break the chain of the spread of the COVID-19 virus, one of the steps taken by the government in dealing with COVID-19 by implementing the New Normal policy. The author's aim of this study is to calculate the accuracy of the K-Nearest Neighbor method in classifying sentiments from public opinion regarding the implementation of the new normal policy. This research was conducted through several stages, namely collecting data from accounts managed by the government. After that, the data is preprocessed. Then create a model using word embedding FastText. Then use feature engineering to improve to produce the best features. The dataset in this study amounted to 4717 data which was divided into 1456 pro class data, 1662 neutral class data, 1599 contra class data. The test was carried out using a confusion matrix by testing training data and test data 3 times with a data comparison of 90:10, namely the accuracy value of 60.169% and at k-40 with a ratio of 80:20, namely the accuracy value of 60.16%, while the lowest accuracy there is a comparison of 70:30 data that is 58.12%.Keywords: New Normal, Instagram, Classification, Sentiment, K-Nearest Neighbor
Covid-19 has been a dangerous outbreak for the world that has lasted more than 2 years. Covid-19 has evolved or developed into several new variations, such as delta which is more dangerous than its initial variant. Vaccines became the world's solution to defend against Covid-19. In Indonesia, at the early stages of implementing mass vaccination programs, people had been involved in many pros and cons, to support or against the program. On social media such as Twitter, public opinions about vaccines are very diverse. This study investigates public sentiment towards the early stage of vaccination program conducted by the government. The classification method used in the sentiment analysis is the Support Vector Machine (SVM), among the positive, negative and neutral classes, with word embeddings extraction features. Data was collected and labeled by 12 crowd sourced annotators. The training and parameter tuning process was carried out to find the model that produced the best accuracy of validation data. From 400 testing data, the application of this optimal model resulted in an F1-score of 65% and an accuracy of 69%, higher than several machine learning methods in the same study.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.