A utilização de técnicas de Mineração de Textos na descoberta de informações relevantes em bases não estruturadas vem crescendo consideravelmente. Este assunto se torna cada vez mais relevante devido ao volume de informações textuais divulgadas na web, como também geradas pelas empresas. O atual trabalho apresenta um estudo bibliométrico seguido de uma revisão bibliográfica da mineração de textos aplicada a indexação de documentos a fim de identificar os artigos mais importantes, os autores de maior relevância, as revistas científicas com maior abertura para o assunto e os artigos mais alinhados com o tema proposto. Quanto a metodologia, foram selecionados 105 artigos publicados entre 1998 e 2011 nas três bases escolhidas para este estudo, Scopus, Isi of knownledge e Scielo. Os resultados apresentados destacam três autores, três revistas científicas e oito artigos de maior influência com o tema proposto. Os resultados gerados contribuem para o melhor entendimento da mineração de textos dando base para novos pesquisadores e auxiliando no referencial teórico. Palavras chave: Mineração de Textos, Bibliometria, Indexação da Informação
ResumoTécnicas de Mineração de Textos vêm sendo amplamente utilizadas para processamento de grandes volumes de documentos. Contudo, ainda há uma grande defasagem na tentativa de definir uma arquitetura para sistemas transacionais com elementos de inteligência computacional. Este trabalho tem o objetivo de apresentar uma proposta de arquitetura para a construção de um sistema computacional que utiliza técnicas de Mineração de Textos para indexar conteúdos da base do Diário Oficial do município de Itapemirim, no estado do Espírito Santo, transformando a informação antes disponível em linguagem natural para um formato estruturado, passível de ser persistido. Para validar a arquitetura, foi desenvolvido um protótipo em linguagem Java acessível no ambiente Web. Para avaliação da ferramenta, o estudo de caso proposto contou com uma base composta por 22 documentos, contendo 198 atos normativos da base daquele Diário Oficial, para os quais foram identificados bons níveis de precisão e abrangência na recuperação da informação. Este trabalho contribui com a apresentação de uma arquitetura híbrida, composta por elementos do modelo de sistemas transacionais e elementos da Mineração de Textos, além da utilização de padrões de projetos de software. Palavras-chave: Diário Oficial de Cachoeiro de Itapemirim. Indexação de documentos. Mineração de textos. Recuperação da informação. Abstract Text mining techniques have been widely used to process large volumes of documents. However, there is still a large gap when defining the architecture for systems with transactional elements of computational intelligence. The aim of the paper is to outline a proposed architecture to build a computational system that uses text mining techniques to index content from the database of the Official Gazette in the city of
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.