2015 23nd Signal Processing and Communications Applications Conference (SIU) 2015
DOI: 10.1109/siu.2015.7129862
|View full text |Cite
|
Sign up to set email alerts
|

Two new feature extraction methods for text classification: TESDF and SADF

Abstract: Özetçe-Bu çalışmada, metin madenciliği yöntemlerinde sıklıkla kullanılan terim frekansı-ters doküman frekansı (TF-IDF) metoduna dayanan iki yeni metin ağırlıklandırma yöntemi TF.TESDF ve TF.SADF önerilmiştir. Ayrıca önişlem aşamasında yeni bir yöntem olarak "metin sınıflandırmada fiillerin önemsizliği" yaklaşımları ortaya konulmuş ve test edilmiştir. Önerilen yöntemlerin diğer TF-IDF yöntemlerinden daha iyi sonuçlar verdiği görülmüştür. Ön işlem için kullanılan metinlerden fiillerin atılması yöntemi ile elde e… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1
1

Citation Types

0
2
0
2

Year Published

2016
2016
2021
2021

Publication Types

Select...
3
2
1

Relationship

0
6

Authors

Journals

citations
Cited by 6 publications
(4 citation statements)
references
References 5 publications
(6 reference statements)
0
2
0
2
Order By: Relevance
“…Kilic et al [21] used academic articles as a dataset and measured the success of classifying the articles by employing text mining techniques. The dataset created for feature selection was composed of abstracts of 2000 articles from 50 different journals.…”
Section: Related Workmentioning
confidence: 99%
“…Kilic et al [21] used academic articles as a dataset and measured the success of classifying the articles by employing text mining techniques. The dataset created for feature selection was composed of abstracts of 2000 articles from 50 different journals.…”
Section: Related Workmentioning
confidence: 99%
“…There are currently two methods used to reduce the feature dimension: feature selection and feature extraction (see, e.g. Kilic, 2015). Feature selection selects features that have the best ability to distinguish categories based on certain rules to form a new subset in the original feature space.…”
Section: Text Classification Problemsmentioning
confidence: 99%
“…Veri büyük oldugu için Varyasyonel Bayes yöntemiyle çıkarsama yapan Ç evrimiçi SDA [13] yöntemi kullanılmıştır 4 . Model egitildikten sonra, gözetimli sınıflandırmada kullanılmaküzere, her konu bir kategoriye atanmıştır.…”
Section: B Saklı Dirichlet Atamasıunclassified
“…Kılıç ve arkadaşlarının çalışmasında TF-TDF'nın iki yeni varyasyonu tanıtılmış ve Türkçe derlemde başarımın arttıgı gösterilmiştir [4]. Ay ve arkadaşlarının çalışmasında genetik algoritma kullanılmış ve yeni bir nitelik agırlıklandırma yöntemi sunulmuştur [5].…”
Section: Introductionunclassified