Sentiment analysis merupakan proses untuk memahami dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang terkandung dalam suatu kalimat opini. Pada umumnya masyarakat di zaman modern ini menuangkan dan mengekspresikan opininya ke media sosial terhadap berbagai topik, salah satu media sosial yang digunakan adalah twitter. Penelitian ini mencoba menganalisis tweet untuk dilakukan implementasi sentiment analysis terhadap opini masyarakat yang tertuang dalam twitter. Implementasi ini dilakukan dengan mengklasifikasikan tweet untuk mendapatkan informasi sentimen yang terkandung dalam tanggapan masyarakat, salah satu metode pengklasifikasian sentimen yaitu naïve bayes. Metode klasifikasi naïve bayes atau dikenal juga dengan teorema bayes memiliki ciri utama dalam asumsi opini yaitu menggunakan metode probabilitas dan statistik, teorema bayes menghitung nilai probabilitas tertinggi untuk klasifikasi sentimen. Jika suatu kata sering muncul dalam suatu dokumen maka diasumsikan bahwa kata tersebut merupakan kata penting dan diberikan nilai tertinggi, tapi jika kata muncul dalam berbagai dokumen maka kata tersebut bukanlah kata unik maka kata akan diberikan nilai rendah, dalam teorema bayes kata sendiri merupakan suatu unigrams dimana kata merupakan sentimen. Pengujian implementasi berbasis web menggunakan Bahasa Pemograman PHP menujukkan bahwa tweet dapat terklasifikasi secara otomatis. Data diklasifikasikan kedalam 3 (tiga) kelas yaitu, kelas positif, negatif dan netral. Proses dalam melakukan sentiment analysis dilakukan dengan melakukan text processing, setelah melewati tahapan text processing opini akan diklasifikasikan dengan metode klasifikasi naïve bayes ke dalam kelas positif, negatif atau netral. Secara keseluruhan hasil pengujian dengan menerapkan metode klasifikasi naïve bayes untuk mengolah informasi sentimen yang terdapat dalam suatu data tweet secara otomatis yang dikategorikan dalam tiga kelas yaitu positif, negatif dan netral dengan jumlah data latih sebesar 450 dan data uji sebesar 50, didapatkan akurasi sebesar 72%.
9Abstrak-Bahasa merupakan alat komunikasi yang digunakan seseorang untuk menyampaikan ide, gagasan, konsep atau perasaan kepada orang lain. Ragam bahasa yang dimiliki setiap orang berbeda, hal ini dapat menghambat pertukaran informasi karena orang lain tidak memahami maksud dan tujuan yang ingin disampaikan. Mesin Penerjemah Statistik (Statistical Machine Translation) merupakan sebuah pendekatan mesin penerjemah dengan hasil terjemahan yang dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari hasil analisis korpus paralel. Tujuan yang ingin dicapai dalam penelitian ini adalah melakukan perbaikan probabilitas lexical model pada mesin penerjemah statistik bahasa Jawa ke bahasa Indonesia untuk meningkatkan nilai akurasi hasil terjemahan. Pengujian dilakukan dengan membandingkan nilai akurasi hasil terjemahan sebelum dan setelah perbaikan probabilitas lexical model. Penelitian menggunakan korpus paralel sebanyak 5108 kalimat. Pengujian dilakukan dengan dua cara, yaitu pengujian otomatis menggunakan Bilingual Evaluation Understudy (BLEU) dan pengujian oleh ahli bahasa Jawa. Hasil dari pengujian adalah terdapat peningkatan persentase nilai BLEU sebesar 0.30% pada pengujian otomatis dan 10.69% pada pengujian oleh ahli bahasa.Kata Kunci-BLEU score, korpus paralel, lexical model, mesin penerjemah statistik. I. PENDAHULUANBahasa merupakan alat komunikasi yang digunakan seseorang untuk menyampaikan ide, gagasan, konsep atau perasaan kepada orang lain. Adapun fungsi bahasa sebagai alat komunikasi yaitu sarana penyampaian informasi kepada orang lain baik secara lisan maupun tulisan mengenai apa yang ingin disampaikan sebagai media mengekspresikan diri, perasaan, pikiran, keinginan, serta kebutuhan agar orang dapat mengerti maksud dan tujuan yang diinginkan tanpa menghindari tata bahasa yang sudah ada. Berdasarkan Sensus Penduduk pada tahun 2010, dari berbagai bahasa yang terdapat di Indonesia, bahasa Jawa menempati urutan pertama penggunaan bahasa daerah terbanyak yang digunakan sehari-hari dengan persentase 31,79% (68.044.660 juta jiwa) dari total penduduk Indonesia [1].Bahasa Jawa sebagai bahasa terbesar di Indonesia merupakan aset berharga yang harus dipertahankan agar bahasa Jawa tidak terlupakan dalam kehidupan sehari-hari, seperti yang dilakukan Pemerintah Provinsi Jawa Tengah dengan menjadikan bahasa Jawa sebagai pelajaran muatan lokal [2]. Upaya pelestarian bahasa Jawa juga telah dilakukan dengan memasukkan penggunaan bahasa Jawa dalam acara pada media massa dan media elektronik. Beberapa upaya tersebut dinilai belum menjadi solusi optimal dikarenakan faktor media massa yang meracuni bahasa daerah dan bahasa Indonesia dengan maraknya penggunaan dialek Jakarta.Berdasarkan faktor-faktor yang telah dijabarkan, untuk menghindari terjadinya kemerosotan penggunaan bahasa daerah, salah satu caranya adalah dengan mesin penerjemah statistik. Mesin penerjemah statistik (Statistical Machine Translation) merupakan sebuah pendekatan mesin penerjemah dengan hasil terjemahan yang dihasilkan atas dasar mode...
Part of speech (PoS) IntroductionThe dream of automatically translating documents between two languages is one of the oldest pursuits of artificial intelligence research. Now, armed with vast amounts of example translations and powerful computers, we can witness significant progress toward achieving that dream. Statistical analysis of bilingual parallel corpora allow for the automatic construction of machine translation systems. Already, for some language pairs, statistical systems are the best machine translation systems currently available.Statistical Machine Translation is corpus-based and consequently requires a parallel corpus to learn a model [1], [2]. Parallel corpora are different from normal text corpora in that they are not just a collection of texts, but are bilingual or multilingual and structured so that every sentence is linked to its translations.Some works have shown that the translation quality can be increased by using additional features such as lemma, part of speech (PoS), gender and others. In their research, Koehn and Hoang [3] explained that by adding a factor of part-of-speech in English-German translator system, the quality of the translation was increased from 18.04% to 18.15%. They also showed that by using morphological factors and part-of-speech, the English-Spanish translator system quality was increased from 23.41% to 24.25%.Youssef et al.[4] examined the factors on adding part-of-speech on statistical translation system for English-Arabic. Research results showed that the addition of a factor of part-of-speech can improve the quality of translation from 0.6095% to 0.6394%. Razavian and Vogel [5] examined the factors on adding to the statistics based interpreter systems, for EnglishIraqi interpreter system, the quality of the translation was improved from 15.62% to 16.41%; for the Spanish-English translator system, the quality of the translation was improved from 32.53% to 32.84%; and for Arabic-English translator system, the quality of the translation was improved from 41.70% to 42.74%.For English-Indonesian, Sujaini et al.[6] conducted a study of the addition of PoS factors based on a statistical translator system factors. The results of these studies indicated that the PoS factor increased the quality of the English-Indonesian translation of 2%, from 31.26% to 33.26%.Grammatically, words can be divided into two categories: open class and closed class. Open class is a class category which number of words always increases over time, while closed class is a class category whose words are fixed. Grammatically different categories of words, commonly called Part of Speech [1].
Bahasa merupakan alat komunikasi dan kunci pokok yang penting bagi kehidupan manusia, karena dengan menggunakan bahasa kita dapat berinteraksi dan mengetahui informasi yang dibutuhkan, bahasa juga digunakan seseorang untuk menyampaikan ide, gagasan, konsep atau perasaan kepada orang lain. Bahasa yang dimiliki setiap orang berbeda-beda, keragaman bahasa ini dapat menghambat pertukaran informasi karena orang lain tidak memahami maksud dan tujuan yang ingin disampaikan. Oleh karena itu diperlukan penerjemah untuk menjembatani bahasa yang berbeda. Mesin Penerjemah Statistik (Statistical Machine Translation) merupakan sebuah pendekatan mesin penerjemah dengan hasil terjemahan yang dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari hasil analisis korpus paralel. Korpus paralel adalah pasangan korpus yang berisi kalimat-kalimat dalam suatu bahasa dan terjemahannya. Salah satu model yang digunakan untuk menentukan akurasi hasil terjemahan adalah dengan melakukan proses tagging kata per kata dengan mengambil kata dasar dan imbuhannya. Tujuan yang ingin di capai dalam penelitian ini adalah menguji akurasi penerjemahan bahasa Indonesia-Dayak Taman dengan membandingkan nilai akurasi sebelum dan setelah dilakukan proses tagging kata per kata dengan mengambil kata dasar dan imbuhannya. Penelitian menggunakan korpus paralel sebanyak 3110 korpus. Pengujian dilakukan dengan dua cara, yaitu pengujian otomatis menggunakan Bilingual Evaluation Understudy (BLEU) dan pengujian oleh ahli bahasa Dayak Taman. Hasil dari pengujian adalah terdapat peningkatan nilai BLEU sebesar 0.36% pada pengujian otomatis dan 20.57% pada pengujian oleh ahli bahasa.
Teknologi informasi di suatu organisasi yang sudah berjalan harus diaudit agar diketahui kelebihan-kelebihan maupun kekurangannya. Politeknik Sambas (Poltesa) merupakan salah satu politeknik di Kalimantan Barat yang telah menerapkan teknologi dalam proses administrasi maupun akademik sebagai penunjang kegiatannye. Audit yang dilakukan pada Poltesa menggunakan frame work COBIT 2019. Metode yang kami pergunakan pada penelitian ini terdiri dari bebrapa langkah, yaitu perencanaan, tindakan, pengamatan, pengolahan dan analisis data, serta pemberian rekomendasi. Berdasarkan hasil dari audit yang dilakukan pada teknologi informasi Poltesa, didapatkan rata-rata nilai sebesar 3,21 dengan nilai maturity level pada domain antara nilai 2 sampai dengan 4, yang berarti sistem telah dioperasikan dengan baik, akan tetapi belum secara maksimal. Manajemen teknologi informasi yang diharapkan di Poltesa dapat dipenuhi dan telah dilakukan dengan baik, karena nilai antara rata-rata level saat penelitian dilakukan dibandingkan dengan rekomendasi level menunjukkan gap yang tidak terlalu besar.
Universitas Tanjungpura (UNTAN) merupakan universitas negeri yang berada di kota Pontianak. UNTAN memiliki banyak gedung yang tersebar pada lahan dengan luas areal 12.135 m2. Banyaknya gedung ini membuat sebagian orang akan kesulitan dalam mengenali dan mendapatkan informasi mengenai gedung yang berada dalam lingkungan UNTAN. Interaktivitas menjadi salah satu poin yang penting dalam pengembangan sebuah aplikasi. Teknologi Augmented Reality (AR) adalah salah satu teknologi interaksi yang dapat mengintegrasikan obyek virtual dengan lingkungan nyata secara real-time. AR memungkinkan user untuk berinteraksi dengan obyek virtual secara natural. AR yang diimplementasikan pada aplikasi bekerja dengan cara memberikan label pada gedung yang ditampilkan oleh layar smartphone. Teknik tracking AR yang digunakan pada penelitian ini adalah GPS based tracking, dimana teknik ini memanfaatkan data koordinat yang dimiliki oleh gedung untuk memberikan label pada gedung. Pengujian pada penelitian ini dilakukan dengan pengujian akurasi dan kuesioner. Berdasarkan hasil dari pengujian akurasi yang dilakukan, aplikasi yang diimplementasikan dengan teknologi AR ini dapat mengenali gedung dari depan, sisi belakang, sisi kiri maupun sisi kanan gedung dan dari jarak dekat, sedang maupun jauh. Berdasarkan kuesioner yang dibagikan kepada 100 responden, didapatkan bahwa aplikasi yang diimplementasikan dengan teknologi AR dapat mempermudah masyarakat kota Pontianak untuk mengenali gedung yang berada di lingkungan UNTAN, sebesar 89% responden yang merasa dimudahkan oleh teknologi AR. Masyarakat kota Pontianak lebih dimudahkan dengan fitur teknologi AR untuk mengenali gedung di UNTAN daripada menggunakan fitur peta digital, dimana persentase pemilih teknologi AR sebesar 96%. Kata Kunci— Android, sistem pengenalan gedung, universitas tanjungpura, augmented reality, GPS based tracking.
Melanoma is a type of deadly skin cancer. The survival rate of the patients can fall as low as 15.7% if the cancer cell has reached its final stage. Delayed treatment of melanoma can be attributed to its likeness to that of common nevus (moles). Two machine learning models were developed, each with a different approach and algorithm, to detect the presence of melanoma. Image classification is using the regression algorithm, and object detection is using deep learning. The two models are then compared, and the best model is determined according to the achieved metrics. The testing was conducted using 120 testing data and is made up of 60 positive data and 60 negative data. The testing result shows that object detection achieved 70% accuracy than image classification’s 68%. More importantly, linear regression’s 43% false-negative rate is noticeably high compared to convolutional neural network’s (CNN) 25%. A false-negative rate of 43% means almost half of sick patients tested using image classification will be diagnosed as healthy. This is dangerous as it can lead to delayed treatment and, ultimately, death. Thus it can be concluded that CNN is the best method in detecting the presence of melanoma.
Kalimantan Barat merupakan salah satu provinsi di Indonesia yang pariwisatanya berpotensi untuk dikembangkan. Oleh karena itu, feedback dari wisatawan dibutuhkan untuk mengambil tindakan terkait pengembangan kualitas objek wisata Kalimantan Barat agar lebih optimal. Penelitian ini bertujuan untuk membangun sistem yang dapat melakukan sentiment analysis terhadap objek wisata di Kalimantan Barat berdasarkan data ulasan yang ada di Google Maps. Metodologi yang digunakan dalam penelitian ini adalah kerangka kerja IS Research Alan Hevner. Dalam melakukan riset sentiment analysis objek wisata Kalimantan Barat, metode yang digunakan untuk klasifikasi adalah Naïve Bayes. Sebelum melakukan klasifikasi, dilakukan tahap pre-processing yang terdiri dari casefolding, tokenizing, filtering, stemming, dan tahap pembobotan kata menggunakan TF-IDF. Berdasarkan penelitian yang dilakukan, disimpulkan bahwa sistem dapat mengklasifikasikan kelas sentimen ulasan objek wisata yang terdapat pada Google Maps menggunakan metode Naive Bayes dengan nilai akurasi yang bervariasi dari setiap tempat wisata. Nilai akurasi tertinggi adalah 0,76 sedangkan terendah adalah 0,38. Hasil sentimen analisis yang dilakukan pada objek wisata Kalimantan Barat masuk dalam kategori yang positif. Hal ini berdasarkan performa metode Naive Bayes yang menunjukan bahwa nilai rata-rata f1-score kelas positif adalah 0,73 lebih tinggi dibanding kelas netral 0,53 dan negatif 0.14
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.