2022
DOI: 10.30812/matrik.v21i3.1851
|View full text |Cite
|
Sign up to set email alerts
|

Komparasi Ekstraksi Fitur dalam Klasifikasi Teks Multilabel Menggunakan Algoritma Machine Learning

Abstract: Ektraksi fitur dan algoritma klasifikasi teks merupakan bagian penting dari pekerjaan klasifikasi teks, yang memiliki dampak langsung pada efek klasifikasi teks. Algoritma machine learning tradisional seperti Na¨ıve Bayes, Support Vector Machines, Decision Tree, K-Nearest Neighbors, Random Forest, Logistic Regression telah berhasil dalam melakukan klasifikasi teks dengan ektraksi fitur i.e. Bag ofWord (BoW), Term Frequency-Inverse Document Frequency (TF-IDF), Documents to Vector (Doc2Vec), Word to Vector (word… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
2
1

Citation Types

0
2
0
2

Year Published

2022
2022
2024
2024

Publication Types

Select...
6
3

Relationship

0
9

Authors

Journals

citations
Cited by 11 publications
(10 citation statements)
references
References 22 publications
0
2
0
2
Order By: Relevance
“…Penelitian ini menggunakan model ekstraksi fitur TF-IDF dan TF-RF, yang dapat memberikan nilai atau bobot pada term di dokumen algoritma pengajaran mesin untuk klasifikasi teks multilabel, yaitu naive bayes. Tujuan dari penelitian ini adalah untuk membandingkan kedua metode pembobotan yang akan dihitung secara terpisah untuk menentukan kombinasi pembobotan kata yang paling akurat.. [4] Banyak platform media sosial saat ini memungkinkan orang untuk mengekspresikan pendapat, pendapat, dan kritik. Setiap hari, banyak orang memposting di media sosial, salah satunya Twitter.…”
Section: Pendahuluanunclassified
“…Penelitian ini menggunakan model ekstraksi fitur TF-IDF dan TF-RF, yang dapat memberikan nilai atau bobot pada term di dokumen algoritma pengajaran mesin untuk klasifikasi teks multilabel, yaitu naive bayes. Tujuan dari penelitian ini adalah untuk membandingkan kedua metode pembobotan yang akan dihitung secara terpisah untuk menentukan kombinasi pembobotan kata yang paling akurat.. [4] Banyak platform media sosial saat ini memungkinkan orang untuk mengekspresikan pendapat, pendapat, dan kritik. Setiap hari, banyak orang memposting di media sosial, salah satunya Twitter.…”
Section: Pendahuluanunclassified
“…Preprocessing adalah tahap untuk mengolah data teks mentah menjadi data teks yang siap untuk diolah sehingga dapat masuk ketahap selanjutnya [11]. Tahap ini dapat membantu meningkatkan kualitas data yang digunakan dalam analisis dan memastikan hasil analisis yang lebih akurat [12]. Meskipun data pada penelitian ini bersifat numerik, namun untuk memastikan bahwa seluruh data telah berbentuk numerik, bersih dari noise, bebas dari outliers, dan telah distandarisasi, tahap preprocessing menjadi suatu langkah penting yang dilakukan.…”
Section: Preprocessingunclassified
“…Tahap preprosesing diterapkan untuk menghapus noise, missing value, kesalahan, dari jenis data yang tidak dibutuhkan dari data belum terkumpul bertujuan mengganti data mentah agar dapat dianalisis agar dapat menghasilkan pengelompokan data yang dibagi menjadi dua bagian selanjutnya dapat menghasilkan keakuratan prediksi [14]. Data preprocessing merupakan cara preliminary dalam tahapan pemrosesan data Machine Learning.…”
Section: Text Preprosesingunclassified