2011
DOI: 10.22456/2175-2745.11662
|View full text |Cite
|
Sign up to set email alerts
|

Aprendizado e Controle de Robôs Móveis Autônomos Utilizando Atenção Visual

Abstract: Este artigo descreve um modelo de aprendizado por reforço capaz de aprender tarefas de controle complexas utilizando ações e estados contínuos. Este modelo, que é baseado no ator-crítico contínuo, utiliza redes de funções de base radial normalizadas para aprender o valor dos estados e das ações, sendo capaz de configurar a estrutura destas redes de forma automática durante o aprendizado. Além disso, um mecanismo de atenção visual seletiva é utilizado para perceber o ambiente e os estados. Para a validação do m… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1

Citation Types

0
0
0
1

Year Published

2012
2012
2012
2012

Publication Types

Select...
2

Relationship

0
2

Authors

Journals

citations
Cited by 2 publications
(1 citation statement)
references
References 21 publications
(34 reference statements)
0
0
0
1
Order By: Relevance
“…O uso da arquitetura de aprendizado adotada justifica-se pelo grande número de iterações que algoritmos de aprendizado por reforço tradicionais exigem, pela simplicidade de obtenção de conhecimento, e para a experimentação de tal estrutura em um sistema multirrobótico, com a possibilidade de compartilhamento de informação. Arquiteturas de aprendizado online na forma de redes neurais crescentes foram, também, alternativas para a solução de aprendizado online em outros trabalhos recentes (Heinen e Engel, 2010) (Silva et al, 2012). O problema da escolta foi escolhido porque sua eficácia é sensivelmente dependente de um número de robôs razoável, visto que o agente precisa ser coberto pelos robôs, e porque se trata de um problema de navegação de dificuldade considerável porque os robôs não só devem perseguir um agente móvel como evitar colisões entre os robôs e eventuais obstáculos do ambiente.…”
Section: Objetivosunclassified
“…O uso da arquitetura de aprendizado adotada justifica-se pelo grande número de iterações que algoritmos de aprendizado por reforço tradicionais exigem, pela simplicidade de obtenção de conhecimento, e para a experimentação de tal estrutura em um sistema multirrobótico, com a possibilidade de compartilhamento de informação. Arquiteturas de aprendizado online na forma de redes neurais crescentes foram, também, alternativas para a solução de aprendizado online em outros trabalhos recentes (Heinen e Engel, 2010) (Silva et al, 2012). O problema da escolta foi escolhido porque sua eficácia é sensivelmente dependente de um número de robôs razoável, visto que o agente precisa ser coberto pelos robôs, e porque se trata de um problema de navegação de dificuldade considerável porque os robôs não só devem perseguir um agente móvel como evitar colisões entre os robôs e eventuais obstáculos do ambiente.…”
Section: Objetivosunclassified