Özetçe-Bu çalışmada, metin madenciliği yöntemlerinde sıklıkla kullanılan terim frekansı-ters doküman frekansı (TF-IDF) metoduna dayanan iki yeni metin ağırlıklandırma yöntemi TF.TESDF ve TF.SADF önerilmiştir. Ayrıca önişlem aşamasında yeni bir yöntem olarak "metin sınıflandırmada fiillerin önemsizliği" yaklaşımları ortaya konulmuş ve test edilmiştir. Önerilen yöntemlerin diğer TF-IDF yöntemlerinden daha iyi sonuçlar verdiği görülmüştür. Ön işlem için kullanılan metinlerden fiillerin atılması yöntemi ile elde edilen başarının neredeyse hiç değişmediği, işlenecek verinin ortalama 1/6 oranında azaldığı gözlemlenmiştir.
AnahtarKelimeler -metin sınıflandırma, terim ağırlıklandırma, ters doküman frekansı. Abstract -In this study, two new document weighting methods are proposed based on term frequency-inverse document frequency (TF-IDF) generally used in text mining methods. Also, insignificance of the verb in text classification which will be a new method in pre-processing have been put forward and tested. The better results were observed through using these methods when these methods compare with other method, It was observed that the performance rate hardly change and the data size which was processed decreased by omitting verbs of texts.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.