The indexed Web increases every day, making the development of automatic methods for knowledge extraction more relevant. The area of Sentiment Analysis or Opinion Mining aims to extract opinions from the user-generated content and to define the semantic orientation of each individual opinion. This work proposes an approach to estimate the degree of importance of comments generated by web users by using a Fuzzy system. The Fuzzy system has three inputs: author reputation, number of tuples f eature, quality word , and percentage of correctly spelled words and one output: importance degree of the comment. The importance degree has been used to select the best comments in a Corpus. The paper also describes an experiment which was used to compare the results of a sentiment orientation method before and after the selection of the best comments. It was conducted with 1620 reviews also about smartphones (982 positives and 594 negatives) and our approach improved the results of sentiment orientation method up to approximately 10% in f-measure in positive reviews and 20% in f-measure in negative reviews.
Abstract-Over the past few years, neural networks have reemerged as powerful machine-learning models, yielding state-ofthe-art results in fields such as image recognition and speech processing. More recently, neural network models started to be applied also to textual natural language signals, again with very promising results. This paper show a series of experiments with Convolutional Neural Networks for sentence-level classification tasks with different hyperparameter settings and how sensitive model performance is to changes in these configurations.Index Terms-Natural language processing, Sentiment analysis, Deep neural network. I. INTRODUÇÃOAnálise de Sentimentos (AS)é o campo de estudo que analisa as opiniões das pessoas, sentimentos, avaliações, atitudes, e emoções com respeito as entidades e seus atributos expressos em texto escrito [1]. Com o rápido crescimento das redes sociais, muitas pessoas têm compartilhado suas visões e opiniões na Internet, através de reviews, fóruns de discussões, blogs, notícias e comentários diversos.A oportunidade de capturar a opinião de um público geral tem levantado o crescente interesse da comunidade científica (por causa dos excitantes desafios abertos) e da comunidade de negócios (por causa dos notáveis benefícios para o marketing e as previsões do mercado financeiro). Hoje, pesquisadores tem suas aplicações nos mais diferentes cenários. Há um bom número de companhias, de grande e pequena escala, que focam na análise de opiniões e sentimentos como parte das suas missões [2]. Assim sendo, esse fascinante problema tem ficado cada vez mais importante na sociedade e nos negócios.Recentemente, as Redes Neurais Convolucionais (do inglês Convolutional Neural Network -CNN) obtiveram impressionantes resultados na importante tarefa de classificação de sentenças [3]- [8]. No entanto, o espaço de possíveis configurações para esse modeloé vasto, o treinamento do mesmoé relativamente lento e ajustar esses parâmetroś e bastante custoso, especialmente porque a estimação dos parâmetrosé computacionalmente intensivo, mesmo usando GPUs 1 .1 Graphics Processing Unit,é o nome dado a um tipo de microprocessador especializado em processar gráficos.Por isso, neste trabalho reportamos resultados de um grande número de experimentos explorando diferentes configurações de um modelo CNN com arquitetura fixa para classificação de sentimentos em nível de sentença. Nossos objetivos são identificar empiricamente as configurações que os profissionais normalmente gastam esforços e prover modelos com variações dos parâmetros.Assim sendo, foram feitos experimentos sobre CNNs de apenas uma camada para exclusão de modelos mais complexos e devidoà sua simplicidade comparativa e forte desempenho empírico, em um conjunto de dados reais coletados do Mercado Livre 2 , reportando acurácia, precisão, cobertura e medida-F, que são métricas que comparam os resultados obtidos contra os resultados esperados determinados pelo rótulo das classes, para explorar os efeitos dos componentes na performasse do modelo.O restante...
Abstract. This paper is a comparative study about text feature extraction methods in statistical learning of sentiment classification. Feature extraction is one of the most important steps in classification systems. We use stylometry to compare with TF-IDF and Delta TF-IDF baseline methods in sentiment classification. Stylometry is a research area of Linguistics that uses statistical techniques to analyze literary style. In order to assess the viability of the stylometry, we create a corpus of product reviews from the most traditional online service in Portuguese, namely, Buscapé. We gathered 2000 review about Smartphones. We use three classifiers, Support Vector Machine (SVM), Naive Bayes, and J48 to evaluate whether the stylometry has higher accuracy than the TF-IDF and Delta TF-IDF methods in sentiment classification. We found the better result with the SVM classifier (82,75%) of accuracy with stylometry and (72,62%) with Delta TF-IDF and (56,25%) with TF-IDF. The results show that stylometry is quite feasible method for sentiment classification, outperforming the accuracy of the baseline methods. We may emphasize that approach used has promising results.
Automatic Essay Scoring (AES) is the computer technology that evaluates and scores the written essays, aiming to provide computational models to grade essays automatically or with minimal human involvement. While there are several AES studies in a variety of languages, few of them are focused on the Portuguese language. The main reason is the lack of a corpus with manually graded essays. We create a large corpus with several essays written by Brazilian high school students on an online platform in order to bridge this gap. All of the essays are argumentative and were scored across five competences by experts. Moreover, we conducted an experiment on the created corpus and showed challenges posed by the Portuguese language. Our corpus is publicly available at https://github.com/rafaelanchieta/essay.
Através de reviews, consumidores podem se comunicar com os fornecedores de produtos e serviços e influenciar a decisão de compra de outros consumidores na Internet. Porém, com o alto número de reviews publicados diariamente, é difícil identificar quais textos devem ser lidos. Como uma solução para esse problema, alguns sites utilizam um sistema de avaliação de reviews baseado no voto dos usuários que embora útil, nem sempre é ideal. Este trabalho propõe um modelo de análise automática da utilidade de reviews online de usuários do Steam, usando Rede Neural Artificial Perceptron Multicamadas. Descobriu-se que certas características de reviews afetam a percepção de utilidade e discutimos aplicações e pesquisas futuras.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.