AbstrakSalah satu metode peringkasan teks otomatis yang sederhana dan dapat meminimalkan redundansi pada ringkasan adalah metode Maximum Marginal Relevance (MMR). Metode MMR memiliki kelemahan yaitu terdapat bagian-bagian yang terpisah satu sama lain dalam hasil ringkasan yang secara semantic tidak terhubung. Oleh karena itu, penelitian ini bertujuan untuk membandingkan hasil ringkasan menggunakan metode MMR berbasis semantic dan MMR berbasis non-semantic. Metode MMR berbasis semantic memanfaatkan WordNet Bahasa dan corpus dalam pemrosesan ringkasan teks. Metode MMR berbasis non-semantic menggunakan metode TF-IDF. Penelitian ini juga melakukan pemampatan ringkasan sebesar 30%, 20% dan 10%. Data penelitian yang digunakan berupa 50 teks berita online. Pengujian hasil ringkasan teks dilakukan dengan menggunakan toolkit ROUGE.. Hasil penelitian menyatakan bahwa nilai rata-rata f-score terbaik pada metode MMR berbasis semantic adalah 0,561, sedangkan nilai f-score terbaik pada metode MMR berbasis non-semantic adalah 0,598. Nilai tersebut dihasilkan dengan menambahkan proses preprocessing berupa stemming dan pemampatan hasil ringkasan 30%. Perbedaan nilai yang diperoleh disebabkan oleh ketidaklengkapan WordNet Bahasa dan terdapat beberapa kata di dalam judul berita yang tidak sesuai dengan EYD (KBBI).
Kata kunci-peringkasan teks otomatis, metode MMR, semantic, non-semantic
AbstractOne simple automatic text summarization method that can minimize redundancy, in summary, is the Maximum Marginal Relevance (MMR) method. The MMR method has the disadvantage of having parts that are separated from each other in summary results that are not semantically connected. Therefore, this study aims to compare summary results using the MMR method based on semantic and non-semantic based MMR. Semantic-based MMR methods utilize WordNet Bahasa and corpus in processing text summaries. The MMR method is nonsemantic based on the TF-IDF method. This study also carried out summary compression of 30%, 20%, and 10%. The research data used is 50 online news texts. Testing of the summary text results is done using the ROUGE toolkit. The results of the study state that the best value of the f-score in the semantic-based MMR method is 0.561, while the best f-score in the nonsemantic MMR method is 0.598. This value is generated by adding a preprocessing process in the form of stemming and compression of a 30% summary result. The difference in value obtained is due to incomplete WordNet Bahasa and there are several words in the news title that are not in accordance with EYD (KBBI).