2007
DOI: 10.1590/s0103-17592007000200004
|View full text |Cite
|
Sign up to set email alerts
|

Aprendizado da coordenação de comportamentos primitivos para robôs móveis

Abstract: Para ter uma aplicação real, um robô móvel deve poder desempenhar sua tarefa em ambientes desconhecidos. Uma arquitetura para robôs móveis que se adapte ao meio em que o robô se encontra é então desejável. Este trabalho apresenta uma arquitetura adaptativa para robôs móveis, de nome AAREACT, que aprende como coordenar comportamentos primitivos codificados por Campos Potenciais através de Aprendizado por Reforço. A atuação da arquitetura proposta, após uma fase de aprendizado inicial, é comparada com a apresent… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
1
0
6

Year Published

2011
2011
2020
2020

Publication Types

Select...
4
1

Relationship

0
5

Authors

Journals

citations
Cited by 5 publications
(7 citation statements)
references
References 9 publications
0
1
0
6
Order By: Relevance
“…The actively controlled devices perform their actions according to predetermined schedules; semi-actively or passively controlled devices reflect the physical movement of the controller, minimizing or maximizing the strength and range, allowing to perform actions that would be impossible without this aid. Moreover, are already available robots with locomotive capacity to develop reactive behaviors, for example obstacles, and build an evolutionary learning to adapt to different environments, whose refinement could produce important advances in robotics 26 .…”
Section: Resultsmentioning
confidence: 99%
“…The actively controlled devices perform their actions according to predetermined schedules; semi-actively or passively controlled devices reflect the physical movement of the controller, minimizing or maximizing the strength and range, allowing to perform actions that would be impossible without this aid. Moreover, are already available robots with locomotive capacity to develop reactive behaviors, for example obstacles, and build an evolutionary learning to adapt to different environments, whose refinement could produce important advances in robotics 26 .…”
Section: Resultsmentioning
confidence: 99%
“…Conforme [11], reforços intermediários são importantes para acelerar o aprendizado, no entanto, esses reforços devem ter valores inferiores aquele recebido quando o robô atinge o alvo.…”
Section: R(s A)unclassified
“…Em uma publicação recente dos autores deste trabalho, é avaliado o desempenho do algoritmo Q-learning na solução do Problema do Caixeiro Viajante, verificando os resultados da variação da polítca ε-greedy e da taxa de aprendizado [10]. Ainda na literatura, o método mais simples e muito utilizado é a definição dos parâmetros α e γ constantes em um única combinação inicial, como nos trabalhos [11] [12] [13] [14] [15].…”
Section: Introductionunclassified
“…Dessa forma, o objetivo de "marcar um gol" pode ser desmembrado em "obter posse de bola", "driblar em direçãoà meta" e "chutar em direção ao gol". Reforços intermediários são importantes para acelerar o aprendizado, no entanto, esses reforços devem ter valores inferioresàquele recebido quando o robô atinge o alvo [7].…”
Section: Definição Da Matriz De Recompensas Imediatasunclassified
“…Desde a elaboração do Q-learning, pesquisas e publicações vem propondo diferentes aplicações e análises para o AR. Robótica móvel [7], otimização na produção de petróleo [8], tráfego aéreo [9] e controleótimo de descarregadores de navios [10] são alguns exemplos de aplicações do AR encontrados na literatura. Outras pesquisas atuam na linha de tentar diminuir o tempo gasto para convergência dos algoritmos de AR.…”
Section: Introductionunclassified