2008 11th International Conference on Computer and Information Technology 2008
DOI: 10.1109/iccitechn.2008.4803111
|View full text |Cite
|
Sign up to set email alerts
|

Making good choices of non-redundant n-gramwords

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
1
0
7

Publication Types

Select...
5

Relationship

1
4

Authors

Journals

citations
Cited by 5 publications
(8 citation statements)
references
References 11 publications
0
1
0
7
Order By: Relevance
“…Figura 4.3: Geração de atributos na metodologia de avaliaçãó E importante ressaltar que, embora a metodologia de Moura et al (2008a) adote o uso de termos compostos (n-gramas) para fins de maior compreensibilidade da taxonomia de tópicos extraída, a avaliação aqui apresentada sugere a utilização de apenas termos simples. Essa decisão se deve ao fato de que, conforme afirmado em Moura et al (2008c), métodos de seleção de atributos que analisam estatisticamente a freqüência dos termos, como os aqui mostrados, são mais confiáveis para conjuntos de termos simples, pois apresentam tendência em favorecer termos que não são muito freqüentes nem muito raros. Experimentalmente,é fácil perceber que os termos compostos mais interessantes são, geralmente, os termos com maiores freqüência, embora essa não seja condição suficiente para considerá-los termos relevantes ao domínio.…”
Section: Geração De Atributosunclassified
See 2 more Smart Citations
“…Figura 4.3: Geração de atributos na metodologia de avaliaçãó E importante ressaltar que, embora a metodologia de Moura et al (2008a) adote o uso de termos compostos (n-gramas) para fins de maior compreensibilidade da taxonomia de tópicos extraída, a avaliação aqui apresentada sugere a utilização de apenas termos simples. Essa decisão se deve ao fato de que, conforme afirmado em Moura et al (2008c), métodos de seleção de atributos que analisam estatisticamente a freqüência dos termos, como os aqui mostrados, são mais confiáveis para conjuntos de termos simples, pois apresentam tendência em favorecer termos que não são muito freqüentes nem muito raros. Experimentalmente,é fácil perceber que os termos compostos mais interessantes são, geralmente, os termos com maiores freqüência, embora essa não seja condição suficiente para considerá-los termos relevantes ao domínio.…”
Section: Geração De Atributosunclassified
“…Experimentalmente,é fácil perceber que os termos compostos mais interessantes são, geralmente, os termos com maiores freqüência, embora essa não seja condição suficiente para considerá-los termos relevantes ao domínio. Ainda em Moura et al (2008c)é possível encontrar um eficiente método para seleção de termos compostos, subseqüenteà seleção de termos simples, baseado na não-redundância de termos.…”
Section: Geração De Atributosunclassified
See 1 more Smart Citation
“…Como resultado indireto, houve a participação no trabalho de Moura et al (2008) com contribuições em trabalhos relacionados ao problema aqui tratado.…”
Section: Conclusõesunclassified
“…These methods analyse the representativeness of the joint occurrence of the terms that compose the n-gram. For example, in the work of Tan et al (2002), a bi-gram is generated if at least one of the terms that compose it is frequent in a docu-ment; in the work of Rossi et al (2012), the compound term is generated if its frequency and a measure of relation are higher than threshold values; and in the work of Moura et al (2008c) the number of compound terms is reduced by analysing the redundancy among the frequencies of the words that compose the terms.…”
Section: Pre-processingmentioning
confidence: 99%