2017
DOI: 10.21814/lm.9.1.243
|View full text |Cite
|
Sign up to set email alerts
|

LinguaKit: uma ferramenta multilingue para a análise linguística e a extração de informação

Abstract: Este artigo apresenta LinguaKit, uma suite multilingue de ferramentas de análise, extração, anotação e correção linguísticas. LinguaKit permite realizar tarefas tão diversas como a lematização, a etiquetagem morfossintática ou a análise sintática (entre outras), incluindo também aplicações para a análise de sentimentos (ou minaria de opiniões), a extração de termos multipalavra, ou a anotação concetual e ligação a recursos enciclopédicos tais como a DBpedia. A maior parte dos módulos funcionam para quatro vari… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
5
0
11

Year Published

2017
2017
2022
2022

Publication Types

Select...
4
4
2

Relationship

2
8

Authors

Journals

citations
Cited by 27 publications
(18 citation statements)
references
References 10 publications
0
5
0
11
Order By: Relevance
“…We performed different experiments on binary polarity classification for knowing (a) the accuracy of the system, (b) the impact of the merged resources, and (c) the impact of the universal rules in monolingual and multilingual settings: The performance of our system was compared to LinguaKit (LKit), an open-source toolkit which performs supervised sentiment analysis in several languages (Gamallo et al, 2013;Gamallo and Garcia, 2017). Table 4 shows the results of each of these models on the different corpora.…”
Section: Methodsmentioning
confidence: 99%
“…We performed different experiments on binary polarity classification for knowing (a) the accuracy of the system, (b) the impact of the merged resources, and (c) the impact of the universal rules in monolingual and multilingual settings: The performance of our system was compared to LinguaKit (LKit), an open-source toolkit which performs supervised sentiment analysis in several languages (Gamallo et al, 2013;Gamallo and Garcia, 2017). Table 4 shows the results of each of these models on the different corpora.…”
Section: Methodsmentioning
confidence: 99%
“…Por ejemplo, el proyecto Corpógrafo (Sarmento et al, 2006) es un gestor de corpus que utiliza técnicas de procesamiento de lenguaje para extracción de términos y extracción de relaciones léxicas. Asimismo, LinguaKit es una herramient multilingüe para el análisis, la extracción, antotación y corrección lingüística (Gamallo & Garcia, 2017).…”
Section: Software Relacionadounclassified
“…O anotador morfossintáctico (que inclui o lematizador) integrado no LinguaKit foi avaliado para três línguas, nomeadamente inglês, português e espanhol, com resultados próximos do estado da arte: ≈ 96% para português e espanhol, e ligeiramente mais baixos (≈ 94%) para inglês (Gamallo et al, 2015;. Quanto ao extrator de MWE, foi descrito e avaliado qualitativamente em (Gamallo & Garcia, 2017).…”
Section: Corpusunclassified