2002
DOI: 10.1590/s0103-17592002000300002
|View full text |Cite
|
Sign up to set email alerts
|

Navegação de robôs móveis utilizando aprendizado por reforço e lógica fuzzi

Abstract: Aprendizado por Reforço pode ser visto como uma forma de programar agentes utilizando recompensas e punições para resolver tarefas específicas através de interações com o ambiente. Neste trabalho é investigado o desempenho dos mais importantes algoritmos de aprendizado por reforço: Q-learning, R-learning e H-learning, no contexto de tarefas de navegação evitando colisões. Além disso, é proposto neste trabalho um método de navegação por sonares, denominado R'-learning, que incorpora lógica fuzzy ao algoritmo R-… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
0
0
5

Year Published

2010
2010
2022
2022

Publication Types

Select...
4
2

Relationship

0
6

Authors

Journals

citations
Cited by 6 publications
(5 citation statements)
references
References 5 publications
0
0
0
5
Order By: Relevance
“…Este trabalho mostra a estrutura física e a implementação da estratégia de controle de um robô que tem como objetivo a navegação autônoma, baseado nas aplicações que foram compiladas de uma revisão sistemática da literatura (Faria & Romero, 2002;Romero et al, 2014). A metodologia utilizada baseia-se em projetar uma estrutura de um robô e utilizar um modelo matemático que se aproxime o máximo possível dessa estrutura a fim de que possam ser desenvolvidos os algoritmos…”
Section: Metodologiaunclassified
“…Este trabalho mostra a estrutura física e a implementação da estratégia de controle de um robô que tem como objetivo a navegação autônoma, baseado nas aplicações que foram compiladas de uma revisão sistemática da literatura (Faria & Romero, 2002;Romero et al, 2014). A metodologia utilizada baseia-se em projetar uma estrutura de um robô e utilizar um modelo matemático que se aproxime o máximo possível dessa estrutura a fim de que possam ser desenvolvidos os algoritmos…”
Section: Metodologiaunclassified
“…No entanto, vale ressaltar, que para todos os valores de α > 0, 01, o modelo ajustado registrou desempenho superior ao grupo de referência. Já analisando a razão de chances para o fator de desconto, nota-se que γ = 0,75 alcançou o maior valor (1,17).…”
Section: Nounclassified
“…A navegação autônoma é uma das situações em robótica móvel em que é dado alto enfoque nos estudos de aprendizado por reforço [17] [11] [18] [14] [12]. Nesse tipo de problema, geralmente um agente deve aprender a se movimentar por um ambiente desconhecido, evitando colisões com obstáculos.…”
Section: Introductionunclassified
“…No Brasil, vários grupos de pesquisa têm considerado o problema de planejamento e controle de robôs com a utilização de técnicas distintas. Métodos de planejamento de caminhos em ambientes desconhecidos foram propostos por exemplo em (de Lima Ottoni e Lages, 2005) e (Faria e Romero, 2002). Outros métodos baseados em sensores e inspirados pela biologia podem ser vistos em (Langer et al, 2006) e (Tavares Neto e dos Santos Coelho, 2005).…”
Section: Introductionunclassified