AgradecimentosAo meu pai Ildeberto de Genova Bugatti, exemplo de conduta, caráter, dedicação e dignidade.A minha adorada mãe Ivani Aparecida da Silva Bugatti por seu amor incondicional, carinho, apoio contínuo e constante, por me ensinar a persistir e ser determinado perante todas as dificuldades.A minha namorada Priscila Tiemi Maeda Saito por estar ao meu lado em todos os momentos, por dividirmos juntos cada conquista, cada realização, felicidades e infelicidades, problemas e soluções, transpormos todos os empecilhos, por ser a razão de tudo, por todo seu carinho e Amor.Ao meu irmão e melhor amigo, Fábio Henrique Bugatti pelos agradáveis e divertidos momentos de devaneio, por sua amizade e companheirismo.A minha orientadora Profa. Dra. Agma Juci Machado Traina por ter acreditado em mim e dado a grande oportunidade e honra de trabalhar ao seu lado, por transmitir tanto conhecimento, sabedoria, delicadeza e incentivo em todos os momentos.Ao professor Dr. Caetano Traina Júnior pelo apoio, valiosas sugestões e revisões.
A todos os amigos do Grupo de Bases de Dados e Imagens (GBdI).A minha tia Dirce e primas Télia e Fernanda por terem estendido a mão quando mais precisei.A FAPESP pelo apoio financeiro. E por fim a todo e qualquer leitor do presente trabalho pelo interesse manifestado.i ii
ResumoA recuperação de imagens baseada em conteúdo (Content-based Image Retrieval -CBIR) embasa-se sobre dois aspectos primordiais, um extrator de características o qual deve prover as características intrínsecas mais significativas dos dados e uma função de distância a qual quantifica a similaridade entre tais dados. O grande desafioé justamente como alcançar a melhor integração entre estes dois aspectos chaves com intuito de obter maior precisão nas consultas por similaridade. Apesar de inúmeros esforços serem continuamente despendidos para o desenvolvimento de novas técnicas de extração de características, muito pouca atenção tem sido direcionadaà importância de uma adequada associação entre a função de distância e os extratores de características.A presente Dissertação de Mestrado foi concebida com o intuito de preencher esta lacuna. Para tal, foi realizada a análise do comportamento de diferentes funções de distância com relação a tipos distintos de vetores de características. Os três principais tipos de características intrínsecasàs imagens foram analisados, com respeito a distribuição de cores, textura e forma. Além disso, foram propostas duas novas técnicas para realização de seleção de características com o desígnio de obter melhorias em relaçãoà precisão das consultas por similaridade. A primeira técnica emprega regras de associação estatísticas e alcançou um ganho de até 38% na precisão, enquanto que a segunda técnica utilizando a entropia de Shannon alcançou um ganho de aproximadamente 71% ao mesmo tempo em que reduz significantemente a dimensionalidade dos vetores de características.O presente trabalho também demonstra que uma adequada utilização das funções de distância melhora efetivamente os resultados das consultas...