Russian News Similarity Detection with SBERT: pre-training and fine-tuning

Vatolin, A. S.; SberBank,; Moscow, Russia; Smirnova, Elena Y.; Shkarin, S. S.

doi:10.28995/2075-7182-2021-20-692-697

Cited by 2 publications

(1 citation statement)

References 7 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…Kedua string tersebut dimasukkan ke dalam fungsi matematis tertentu untuk mengetahui jarak antara keduanya [3]. Menghitung jumlah kemiripan kata adalah tugas umum, namun memberikan peran yang sangat penting dalam berbagai aplikasi Natural Language Processing (NLP), seperti mesin pencari, detektor plagiarisme, sistem penjawab pertanyaan, dan lainnya [4]. Tentu saja menghitung jumlah kemiripan kata sangat bisa digunakan untuk mendeteksi tingkat plagiat pada artikel ilmiah, mengingat karya ilmiah merupakan hasil pemikiran seseorang yang dituangkan dalam belum teks.…”

Section: Pendahuluanunclassified

Akurasi dalam Mengidentifikasi Tingkat Similarity pada Artikel Ilmiah Menggunakan Algorithma Jaro Winkler

Santosa

2022

jidt

View full text Add to dashboard Cite

Plagiarisme merupakan isu yang kerap berkembang dan selalu terjadi khususnya di Perguruan Tinggi. STKIP Rokania telah memiliki sistem pencatatan artikel ilmiah yang bernama E-Jurnal yang selalu digunakan oleh dosen untuk mempublikasikan jurnal dan mencari topik dan literatur yang relevan. Dalam pembuatan artikel ilmiah, sering sekali tidak terdeteksinya tindakan plagiarism terhadap artikel ilmiah yang diajukan oleh dosen. Kecurangan ini dilakukan dengan mengkombinasikan abstrak-abstrak yang telah tersedia sehingga membentuk satu abstrak hasil penggabungan. Artinya abstrak bukanlah hasil yang dibuat sendiri oleh peneliti. Permasalahan terbesarnya adalah ketika tidak terdeteksinya tindakan kecurangan ini yang disebabkan pengecekan dokumen dilakukan secara manual. Hal ini tentu saja dapat mengakibatkan menurunkan reputasi E-Jurnal yang sudah terakreditasi tersebut. Permasalahan ini tentu saja harus segera diberikan solusi yang tepat untuk mengidentifikasi tingkat similarity pada artikel ilmiah yang sudah ada sebelumnya. Identifikasi tingkat similariry pada artikel ilmiah dibuat melalui tahapan pengembangan terstruktur menggunakan algoritma Jaro Winkler yang dipilih untuk mendeteksi similaritas dokumen abstrak artikel ilmiah dengan abstrak-abstrak yang telah tersimpan pada basis data E-Jurnal. Sistem akan menampilkan berapa persen tingkat kesamaan abstrak artikel ilmiah tersebut sehingga admin jurnal memberikan keputusan yang tepat saat menerima artikel ilmiah tersebut atau menolaknya. Melalui penelitian ini, dosen dapat melakukan pengecekan awal abstrak dari calon artikel ilmiahnya untuk meminimalkan terjadinya plagiasi. Dengan demikian dapat meminimalisir tindakan kecurangan dosen dalam pembuatan artikel ilmiah dan menghasilkan jurnal yang berkualitas bernilai lebih tinggi.

show abstract

Section: Pendahuluanunclassified

Akurasi dalam Mengidentifikasi Tingkat Similarity pada Artikel Ilmiah Menggunakan Algorithma Jaro Winkler

Santosa

2022

jidt

View full text Add to dashboard Cite

show abstract

Experience of implementing discourse analysis and conceptual mapping of healthy eating communities

Tkach,

Vorobyova,

Rusakova

2024

Sociology: Methodology, Methods, Mathematical Modeling (Sociology: 4M)

View full text Add to dashboard Cite

The article presents the experience of implementing discourse analysis methods as interpreted by E. Laclau and C. Mouffe and the concept mapping method as interpreted by W. Trochim through the network analysis technique using the example of healthy eating. The result of the analysis is a graph that makes it possible to highlight the struggle of discourse agents for the meaning of key discursive signs, as well as the conceptual map of participants in an online discussion on controversial issues within the topic discussed in the article as an example. The empirical basis for the discourse analysis was 3 000 collected comments in four communities about healthy eating on the social networks VKontakte and Odnoklassniki. The modified versions of the methods of concept mapping and discourse analysis were adapted for the analysis of online discussions. Subsequent validation of the methods seems to be a promising direction for further research. The proposed designs have a number of limitations, which are discussed in the article.

show abstract

Russian News Similarity Detection with SBERT: pre-training and fine-tuning

Cited by 2 publications

References 7 publications

Akurasi dalam Mengidentifikasi Tingkat Similarity pada Artikel Ilmiah Menggunakan Algorithma Jaro Winkler

Akurasi dalam Mengidentifikasi Tingkat Similarity pada Artikel Ilmiah Menggunakan Algorithma Jaro Winkler

Experience of implementing discourse analysis and conceptual mapping of healthy eating communities

Contact Info

Product

Resources

About