Güran, Aysun (Dogus Author) -- Conference full title: 2014 22nd Signal Processing and Communications Applications Conference (SIU) = 2014 22. Sinyal İşleme ve İletişim Uygulamaları Kurultayı (SİU): 23-25 April 2014, Trabzon, Turkey.Bu çalışmanın amacı, bir dokümandaki en önemli cümleleri seçerek ilgili dokümanın özetini çıkarmaktır. Bu amaçla 15 farklı cümle seçim metodu kullanılmıştır. Bu metotlar, 15 kadın ve 15 erkek olmak üzere, toplam 30 kişi tarafından çıkarılmış özet dokümanlarının oluşturduğu bir değerlendirme veri seti üzerinde kıyaslanmıştır. Ayrıca, bu metotlardan en başarılı olanlarının birlikte kullanılması ile elde edilen farklı özellik gruplarının başarım değerleri sergilenmiş ve analiz sonuçları paylaşılmıştır.The aim of this work is to create text summaries by selecting the most important sentences of documents. For this aim 15 sentence selection methods are used. These methods are compared on the evaluation set created by 15 women and 15 men evaluators. The performance results of the systems that are obtained by using different sentence selecetion methods together are also analyzed and the results are shared
A b str a c t: T his study presents a novel hybrid Turkish text sum m arization system that com bines structural and semantic features. T h e system uses 5 structural features, 1 o f w hich is newly proposed and 3 are semantic features whose values are extracted from Turkish W ikipedia links. T h e features are com bined using the weights calculated by 2 novel approaches.
Öz Son yıllarda dengesiz tıbbi veri kümeleri üzerinde gerçekleştirilen öğrenme problemine verilen önem artmaktadır. Çünkü gerçek yaşamda karşılaşılan tıbbi veri kümeleri sıklıkla dengesiz veri kümeleridir. Sınıflandırıcıların dengesiz ortamdaki davranışlarını inceleyen pek çok çalışma, başarım değerlerindeki önemli kaybın veri kümelerinde oluşan çarpık sınıf dağılımından kaynaklandığını vurgulamıştır. Literatürde, bu çarpıklık sorununu çözmek için Sentetik Azınlık Örneklem Arttırma Yöntemi (SMOTE) algoritması önerilmiştir. Bu çalışmada, hastanelere yapılan şüpheli bir Covid-19 vaka başvurusunda, yaygın olarak toplanan laboratuvar test sonuçlarına dayanarak, SARS-Cov-2 test sonucu negatif veya pozitif sınıfa sahip hastaları SMOTE ve YSA modeli kullanarak daha yüksek oranla tahmin etmeye yönelik deneysel çalışma yapılmıştır. Orijinal veri kümesinin YSA ile sınıflandırılması sonucunda doğruluk değeri 0.86, F-ölçüm değeri 0.48 bulunmuş olup, SMOTE ile dengelenen veri kümesinin yine YSA ile sınıflandırılması sonucunda doğruluk değeri 0.90, F-ölçüm değeri 0.68 bulunmuştur. Bu nedenle SMOTE ile dengelenmiş Covid-19 veri kümesinin YSA ile sınıflandırılması sonucunda daha başarılı sonuçlar bulunmuştur. Çalışmamızın sonunda orijinal ve SMOTE ile dengelenen veri kümesi arasında karşılaştırma yapılmış olup, sınıflandırıcının diğer başarım değerlerini de arttırdığı görülmüştür.
Sentiment Analysis of tweets Pearson Correlation and Granger causality analysis between tweets and stock markets Twitter is an influential platform for financial markets in Turkey.In this research an extensive study to identify the relations between Turkish financial-related tweets and the daily changes in Bist30 index returns is presented. After the sentiment analysis of Turkish financial-related tweets, the polarity values of the tweets are determined and the results of Pearson correlation and Granger causality analyses between the polarity values and the changes in Bist30 index returns are examined for two different time periods. The first research period covers the dates between 07.05.2018 and 30.04.2019. The second research period includes the dates between 07.05.2018 and 31.07.2018; where some important events took place in Turkey. To the best of our knowledge, this study is the most comprehensive study that analyses the relations between Turkish financial-related tweets and the daily changes in stock market returns. The framework of the study is shown in Figure A.
Öz TF-IDF terim ağırlıklandırma ölçümü kelimelerin metinler içinde geçme sıklığı bilgisine dayalıdır. Bu ölçüm kelimeler arasındaki anlamsal ilişkiyi barındırmamaktadır. Yapay sinir ağlarına dayalı olan Doc2Vec metodu kelimeler ve kelimeleri içeren dokümanlar arasındaki anlamsal ilişkiyi barındırmakta ve yönetilebilir boyutlu doküman vektörlerinin elde edilmesini sağlamaktadır. Ardışık kelime grubu tespitinin metin madenciliği üzerindeki olumlu etkileri literatürde sunulan pek çok çalışma tarafından belirtilmiştir. Bu çalışmada, hem geleneksel TF-IDF terim ağırlıklandırma ölçümünün, hem de YSA'lara dayalı bir yöntem olan Doc2Vec yönteminin kullanımı ile vektörleştirilen dokümanlar üzerinde temel makine öğrenmesi sınıflandırıcılarının ve topluluk öğrenmesi algoritmalarının başarım değerleri kıyaslanmıştır. Sınıflandırıcılar farklı uzunluklarda haber dokümanlarını içeren 4 farklı Türkçe veri kümesi üzerinde uygulanmıştır. Çalışmamızın literatüre olan katkısı, sınıflandırma aşamasına geçilmeden önce dokümanların içindeki ardışık kelime grubu tespitinin gerçekleştirilmesi ve dokümanların bu kelime öbeklerinin tek bir kelime gibi ele alınmasıyla vektörleştirildikten sonra, uygulanan sınıflandırıcıların başarım değerlerinin arttığının gösterilmesi olmuştur. Ardışık kelime grubu tespiti için kelimelerin birlikte geçme sıklığı prensibine dayalı olan bir prensip dışında, Türkçe Vikipedi'nin kelime bağlantıları da kullanılmış ve dokümanlar içinde az sayıda geçmesine rağmen anlamlı olan ardışık kelime öbeklerinin tespiti gerçekleştirilebilmiştir. Ardışık kelime grubu tespiti ile sınıflandırma deneylerinin hemen hemen tümünde daha yüksek başarım değerleri elde edilmiştir.
Conference: IEEE International Symposium on INnovations in Intelligent SysTems and Applications (INISTA) -- Location: BULGARIA -- Date: JUN 19-21, 2013In this work, we analyze the effects of NMF based dimension reduction methods on clustering of Turkish documents by using k-means clustering algorithm. All experiments are conducted on two different datasets that we call Milliyet4c1k and 1150haber. The NMF based dimension reduction methods have two purposes: to reduce the original vector space by transformation and to reduce size and dimension by summarizing original documents. Experimental results show that NMF transformation yields to better clustering results on both datasets. Using k-means on summarized documents produces almost identical result with k-means on original documents. Although using summaries instead of full documents doesn't improve quality of clustering, we show that it significantly reduces the size of the processed data and execution time of k-means clustering algorithm.IEEE; Bulgarian Sci Acad; Bulgarian Acad Sci, Inst Informat & Commun Technologies; IEEE Bulgarian Sectio
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.