2012
DOI: 10.5120/7817-1105
|View full text |Cite
|
Sign up to set email alerts
|

Combination of K-Nearest Neighbor and K-Means based on Term Re-weighting for Classify Indonesian News

Abstract: KNN is one of the accepted classification tool, it used all training samples in the classification which cause to a high level of computation complexity.To resolve this problem, it is necessary to combine traditional KNN algorithm and K-Means cluster algorithm that is proposed in this paper.After completing the preprocessing step, the first thing to do is weighting the word (term) by usingTerm Frequency-Inverse Document Frequency (TF-IDF). TF-IDF weightedthe words calculating the number of words that appear in… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
9
0
2

Year Published

2013
2013
2022
2022

Publication Types

Select...
8
2

Relationship

0
10

Authors

Journals

citations
Cited by 24 publications
(11 citation statements)
references
References 11 publications
0
9
0
2
Order By: Relevance
“…Menurut [1], data mining adalah proses mengekstraksi informasi dari sekumpulan data yang berukuran besar data tersebut diolah dengan menggunakan algoritma dan teknik menggambar statistik, machine learning serta sistem pengelolaan basis data. Sebagai proses pencarian informasi dari sekumpulan data yang akan dijadikan sebagai pengetahuan baru yang dapat dimanfaatkan maka dari itu data mining juga seringkali dikenal dengan sebutan Knowledge Discovery in Database (KDD Text mining merupakan salah satu metode pencarian informasi dari sekumpulan data teks [4]. Tahapan pada text mining umumnya adalah text preprocessing dan feature selection [5], kata yang terdapat pada data teks yang akan di mining akan dirubah bentuk akhirnya kedalam sebuah kata dasar [6].…”
Section: Pendahuluanunclassified
“…Menurut [1], data mining adalah proses mengekstraksi informasi dari sekumpulan data yang berukuran besar data tersebut diolah dengan menggunakan algoritma dan teknik menggambar statistik, machine learning serta sistem pengelolaan basis data. Sebagai proses pencarian informasi dari sekumpulan data yang akan dijadikan sebagai pengetahuan baru yang dapat dimanfaatkan maka dari itu data mining juga seringkali dikenal dengan sebutan Knowledge Discovery in Database (KDD Text mining merupakan salah satu metode pencarian informasi dari sekumpulan data teks [4]. Tahapan pada text mining umumnya adalah text preprocessing dan feature selection [5], kata yang terdapat pada data teks yang akan di mining akan dirubah bentuk akhirnya kedalam sebuah kata dasar [6].…”
Section: Pendahuluanunclassified
“…Email: sks001@gmail.com available for English language on this field. Recently, several related work on Natural Language Processing has been done on Chinese [8] ,Indonesian [5,6], Hindi [3], Arabic [4,7] , English-Hindi [2], Bengali Language [1] and so on. Resources on these languages are also increasing as more and more research are going on in this field.…”
Section: Revised Manuscript Received On November 19 2019mentioning
confidence: 99%
“… Prinsip K-NN adalah memilih tetangga terdekat dan melakukan klasifikasi dengan voting terbanyak. Karena K-NN konvensional adalah algoritma yang bersifat lazy learner, untuk melakukan klasifikasi K-NN memerlukan seluruh data [26], dan data juga harus sudah disertai dengan kelas atau target, hal ini disebabkan K-NN masuk kedalam kategori terpadu (supervised).…”
Section: F K-nearest Neighbor (K-nn)unclassified