2021
DOI: 10.15575/join.v6i1.640
|View full text |Cite
|
Sign up to set email alerts
|

The Hybrid of Jaro-Winkler and Rabin-Karp Algorithm in Detecting Indonesian Text Similarity

Abstract: The String-matching technique is part of the similarity technique. This technique can detect the similarity level of the text. The Rabin-Karp is an algorithm of string-matching type. The Rabin-Karp is capable of multiple patterns searching but does not match a single pattern. The Jaro-Winkler Distance algorithm can find strings within approximate string matching. This algorithm is very suitable and gives the best results on the matching of two short strings. This study aims to overcome the shortcomings of the … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
2

Citation Types

0
1
0
1

Year Published

2022
2022
2024
2024

Publication Types

Select...
7
2

Relationship

0
9

Authors

Journals

citations
Cited by 12 publications
(4 citation statements)
references
References 14 publications
0
1
0
1
Order By: Relevance
“…Ini terjadi karena frase akar dikelompokkan dan TF-IDF menghitung frekuensi indeks untuk membuat konversi kata dasar menjadi fungsi hash lebih mudah dan lebih akurat. Penelitian selanjutnya dilakukan oleh [12] yang menyatakan bahwa terjadi peningkatan presentasi akurasi algoritma Rabin-Karp pada pengujian kemiripan kata sebesar 20.06% melalui implementasi algoritma Jaro-Winkler pada Rabin-Karp. Namun, tingkat persentase pada pengujian kemiripan kalimat dan abstrak jurnal mengalami penurunan sebesar 15.20%.…”
Section: Pendahuluanunclassified
“…Ini terjadi karena frase akar dikelompokkan dan TF-IDF menghitung frekuensi indeks untuk membuat konversi kata dasar menjadi fungsi hash lebih mudah dan lebih akurat. Penelitian selanjutnya dilakukan oleh [12] yang menyatakan bahwa terjadi peningkatan presentasi akurasi algoritma Rabin-Karp pada pengujian kemiripan kata sebesar 20.06% melalui implementasi algoritma Jaro-Winkler pada Rabin-Karp. Namun, tingkat persentase pada pengujian kemiripan kalimat dan abstrak jurnal mengalami penurunan sebesar 15.20%.…”
Section: Pendahuluanunclassified
“…Algoritma Jaro-Winkler dipilih karena sangat cocok dan sesuai dalam memberikan hasil terbaik pada pencocokan dua string pendek. Penggunaan algoritma Jaro-Winkler telah dilakukan oleh peneliti sebelumnya yaitu, koreksi otomatis dan saran ejaan, fitur, mendeteksi dokumen plagiarisme, stemming kata kompensasi tidak standar bahasa Inggris [5]. Maka dari itu pemerintah, dosen pembimbing, dan pengelola jurnal selalu cermat dan berhati-hati dalam menerima dan memeriksa suatu karya ilmiah, bahkan pemerintah mengeluarkan kebijakan untuk setiap karya ilmiah yang diunggah ke repository kampus wajib dicek plagiasinya [6].…”
Section: Pendahuluanunclassified
“…They are stemming functions to collect title indexes and thesis abstractions as a database so they can be checked using a similarity algorithm. A study [11] related to text similarity detection concluded that implementing the Nazief Adriani stemming method in the Rabin-Karp algorithm greatly affects the percentage level of text similarity, making it easier to detect text similarity.…”
Section: Introductionmentioning
confidence: 99%