AgradecimentosAgradeço a minha família pelo apoio e suporte em todos os momentos. Meus pais, Roberto e Rosa, pela educação, amor e por me ensinarem os verdadeiros valores da vida, e meu irmão Alexandre.Ao Professor Alneu pela orientação e principalmente por sua compreensão e apoio nos momentos mais difíceis.Agradeço aos professores Mauro Biajiz e Caetano Traina pelas sugestões e correções no exame de qualificação que foram fundamentais ao rumo deste projeto. Aos professores Gustavo Nonato e Odemir Bruno pelas sugestões e ajuda nos experimentos com wavelets.Agradeço ao meu amigo Valmir, que desde o início se prontificou a me ajudar, me orientando em todo projeto e implementação de banco de dados. Sua ajuda foi essencial para este trabalho.Aos colegas do Labic, incluindo os keepers Ronaldo, Edson e Richardson, que sempre estiveram prontamente dispostos a me ajudar e aos colegas de projeto Chris, Beto e, em especial, ao Vinicius que me ajudou em diversos momentos. Também tenho que agradecer colegas de outras áreas como Mário, Joselene e Bruno.Aos amigos e companheiros com quem convivi grande parte do tempo nesse período de mestrado, Jean, Maikon e Luis Henrique, e outros amigos muito próximos a mim no dia a dia, Valter e Guilherme.Agradeço a todos amigos da turma PgCompUSP04.Às secretárias da pós-graduaçao, sempre muito prestativas, e todos os funcionários do ICMC.Agradeço aos meus familiares, amigos e todas as pessoas que me ajudaram a chegar até aqui.Por fim, agradeço ao CNPq pelo auxílio financeiro imprescindível para a realização deste trabalho.
ResumoEste trabalho de mestrado insere-se no contexto do projeto de uma Ferramenta Inteligente de Apoio à Pesquisa (FIP), sendo desenvolvida no Laboratório de Inteligência Computacional do ICMC-USP. A ferramenta foi proposta para recuperar, organizar e minerar grandes conjuntos de documentos científicos (na área de computação). Nesse contexto, faz-se necessário um repositório de artigos para a FIP. Ou seja, um Data Warehouse que armazene e integre todas as informações extraídas dos documentos recuperados de diferentes páginas pessoais, institucionais e de repositórios de artigos da Web. Para suportar o processamento analítico on-line (OLAP) das informações e facilitar a "mineração" desses dados é importante que os dados estejam armazenados apropriadamente. Dessa forma, o trabalho de mestrado teve como objetivo principal projetar um Data Warehouse (DW) para a ferramenta FIP e, adicionalmente, realizar experimentos com técni-cas de mineração e Aprendizado de Máquina para automatizar o processo de indexação das informações e documentos armazenados no data warehouse (descoberta de tópicos). Para as consultas multidimensionais foram construídos data marts de forma a permitir aos pesquisadores avaliar tendências e a evolução de tópicos de pesquisa.i
AbstractThis dissertation is related to the project of an Intelligent Tool for Research Supporting (FIP), being developed at the Laboratory of Computational Intelligence at ICMC-USP. The tool was proposed to retrieve, organize, an...