A Deus pelas oportunidades que já tive e por mais uma realização. Aos meus amados pais, Faria e Olga, que me apoiaram emocionalmente e financeiramente, se fazendo presentes em todos os momentos. Ao Marcos Cintra, pela amizade e pelo apoio nos momentos mais difíceis. A minha orientadora, Roseli Aparecida Francelin Romero, que sempre motivou a realização deste projeto, não deixando eu desanimasse quando desafios aumentavam. A minha irmã Kélita, pelo carinho, apoio e compreensão. Ao prof. Dr. Edson Prestes, que contribuiu com muitas idéias para este trabalho, incentivando a pesquisa com múltiplos robôs.
Lista de Tabelas 2.1 Transição de estados 4.1 Reforço imediato definindo a tarefa de navegação 4.2 Classificação das leituras priorizando objetos próximos 4.3 Classificação das leituras priorizando objetos próximos em cinco classes.. . 4.4 Recompensas para os algoritmos R-learning e RL/earning. 5.1 Recompensas para o robô pegador de objetos. vi Lista de Algoritmos 2.1 TD(À) 2.2 Q-learning 2.3 SARSA 2.4 R-learning 2.5 H-1 earning 4.1 It'-learning vii Resumo O problema de aprendizado com robôs é essencialmente fazer com que o robô execute tarefas sem a necessidade de programá-los explicitamente. Nos últimos anos, Aprendizado de Máquina, um subcampo de Inteligência Artificial, tem procurado substituir programação explicita pelo processo de ensinar uma tarefa. O Aprendizado com Reforço é um dos paradigmas do aprendizado não-supervisionado, podendo ser visto como uma forma de ensinar o robô a realizar uma tarefa sem especificar previamente como realizá-la. O problema de aprendizado com reforço pode ser modelado como: um conjunto de estados do ambiente, um conjunto de ações e um conjunto de recompensas Neste trabalho explora-se o potencial dos principais algoritmos de aprendizado com reforço: Q-learning, R-/earning e H-learning. Desta forma, foram comparados métodos "independentes de modelo" e "baseados em modelo", verificando a eficiência de cada algoritmo para a tarefa de navegação em um ambiente dinâmico contendo obstáculos. Além disso, este trabalho propõe um método de navegação baseado em sensores, chamado R'-learning, o qual incorpora conceitos de lógica fuzzy ao algoritmo R-/earning para a navegação de robôs móveis em ambientes desconhecidos. Foi realizada uma aplicação que consiste em ensinar o robô a encontrar pequenos objetos. Para isto, um conjunto de estados foi mapeado através de conceitos de força de repulsão e para navegação foi utilizado o algoritmo R'-learning. O robô mostrou ter um comportamento satisfatório ao realizar esta tarefa.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.