2011
DOI: 10.1007/s10115-011-0412-6
|View full text |Cite
|
Sign up to set email alerts
|

Text document clustering using global term context vectors

Abstract: Despite the advantages of the traditional vector space model (VSM) representation, there are known deficiencies concerning the term independence assumption. The high dimensionality and sparsity of the text feature space and phenomena such as polysemy and synonymy can only be handled if a way is provided to measure term similarity. Many approaches have been proposed that map document vectors onto a new feature space where learning algorithms can achieve better solutions. This paper presents the global term cont… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
3
1
1

Citation Types

0
12
0
7

Year Published

2014
2014
2019
2019

Publication Types

Select...
4
2
1

Relationship

0
7

Authors

Journals

citations
Cited by 36 publications
(20 citation statements)
references
References 22 publications
0
12
0
7
Order By: Relevance
“…, K que minimiza (ou, em alguns casos, maximiza) a função objetivo. A função objetivo é normalmente definida em função da similaridade ou distância entre os documentos, e, em geral, demanda-se também que a associação γ seja sobrejetiva, a fim de garantir que nenhum dos K grupos esteja vazio [24,28].…”
Section: Agrupamento De Objetos Textuaisunclassified
“…, K que minimiza (ou, em alguns casos, maximiza) a função objetivo. A função objetivo é normalmente definida em função da similaridade ou distância entre os documentos, e, em geral, demanda-se também que a associação γ seja sobrejetiva, a fim de garantir que nenhum dos K grupos esteja vazio [24,28].…”
Section: Agrupamento De Objetos Textuaisunclassified
“…A principal contribuição do modeloé o estabelecimento de um arcabouço formal no qual as dependências entre termos possam ser adequadamente representadas, introduzindo novas ideias que são importantes do ponto de vista teórico (Pôssas et al, 2002;Baeza-Yates and Ribeiro-Neto, 2011). Foram propostas na literatura diversas extensões do modelo que visam suprir algumas das deficiências da proposta original, como em Billhardt et al (2002); Farahat and Kamel (2011); Kalogeratos and Likas (2012) ;Cheng et al (2013b). Segundo os autores Baeza-Yates and Ribeiro-Neto (2011), não fica claro em quais situações o modelo GVSM supera o modelo vetorial clássico.…”
Section: Gvsmunclassified
“…Além disso, o modelo bag-of-words não permite identificar os diferentes sentidos que uma mesma palavra pode ter em diferentes contextos, fenômeno conhecido como polissemia, ou compreender e representar a informação de termos diferentes ocorrendo com mesmo significado, fenômeno conhecido como sinonímia. Ainda, esse modelo não reconhece expressões multi-palavras (por exemplo, "inteligência artificial ") (Farahat and Kamel, 2011;Kalogeratos and Likas, 2012;Cheng et al, 2013b).…”
Section: Introductionunclassified
See 2 more Smart Citations