<p>Perkembangan teknologi internet berdampak bertambahnya jumlah situs berita berbahasa Indonesia dan menciptakan ledakan informasi. Hal tersebut menuntut semua informasi bisa diakses dengan cepat dan tidak harus membutuhkan banyak waktu dalam membaca sebuah headline berita.Teknologi peringkas teks otomatis menawarkan solusi untuk membantu pencarian isi berita berupa deskripsi singkat (summary). Penelitian diawali dengan lima tahap text preprocessing: pemecahan kalimat,case folding, tokenizing, filtering, dan stemming. Proses selanjutnya menghitung bobot tf-idf, bobot query relevance dan bobot similarity. Ringkasan dihasilkan dari ekstraksi kalimat dengan menggunakan metode maximum marginal relevance. Metode ekstraksi maximum marginal relevance merupakan metode yang digunakan untuk mengurangi redudansi dalam perangkingan kalimat pada multi dokumen. Data uji coba diambil dari surat kabar berbahasa Indonesia on-line sejumlah 30 berita. Hasil pengujian dibandingkan dengan ringkasan manual yang menghasilkan rata-rata recall 60%, precision 77%, dan f-measure 66%.<em> </em></p><p> </p><p><strong>Kata kunci</strong>: <em>peringkasan</em>, <em>text preprocessing</em><em>, </em><em>tf-idf, </em><em>query </em><em>relevance, </em><em>similarity</em>, <em>maximum marginal relevance</em></p>
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.