Peningkatan jumlah informasi yang tersedia di internet disamping memberikan manfaat, juga memunculkan masalah tersendiri. Mesin pencarian modern sudah cukup baik untuk mendapatkan informasi tertentu. Namun jumlah informasi yang banyak terkadang menyebabkan pencari informasi kesulitan mendapatkan intisari dari informasi yang dicari. Kondisi ini dikenal sebagai information overload. Peringkasan multidokumen otomatis adalah salah satu solusi untuk masalah ini. Meskipun metode peringkasan multidokumen otomatis sudah dikembangkan sejak 20 tahun lalu, penerapannya dalam Bahasa Indonesia masih terbatas. Dalam tulisan ini, kami melaporkan hasil penelitian yang dilakukan pada peringkasan multidokumen berbahasa Indonesia. Artikel dengan topik penyakit menular merupakan salah satu studi kasus yang menarik untuk peringkasan multidokumen Bahasa Indonesia. Informasi mengenai penyakit menular dibutuhkan oleh masyarakat sehingga tersedia banyak informasi mengenai topik ini di internet. Kondisi ini menyebabkan kemungkinan information overload untuk pencarian dalam topik ini. Dalam penelitian ini, diterapkan peringkasan multidokumen otomatis dengan menggunakan Log-Likelihood Ratio (LLR) untuk mendapatkan topic signature, dan Maximal Marginal Relevance pada artikel dengan topik penyakit menular untuk mendapatkan ringkasan dengan sedikit perulangan informasi. Penelitian ini menghasilkan ringkasan dengan nilai akurasi sebesar 0,4 (dengan menggunakan ROUGE-S9). Selain itu, dalam penelitian ini didapatkan bahwa topic signature (beserta akurasinya) memegang peran penting dalam proses peringkasan dokumen otomatis.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.