2020
DOI: 10.1109/access.2020.3018026
|View full text |Cite
|
Sign up to set email alerts
|

Reinforcement Learning for Position Control Problem of a Mobile Robot

Abstract: Due to the increase in complexity in autonomous vehicles, most of the existing control systems are proving to be inadequate. Reinforcement Learning is gaining traction as it is posed to overcome these difficulties in a natural way. This approach allows an agent that interacts with the environment to get rewards for appropriate actions, learning to improve its performance continuously. The article describes the design and development of an algorithm to control the position of a wheeled mobile robot using Reinfo… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
8
0
2

Year Published

2021
2021
2023
2023

Publication Types

Select...
4
3

Relationship

0
7

Authors

Journals

citations
Cited by 18 publications
(12 citation statements)
references
References 33 publications
0
8
0
2
Order By: Relevance
“…Estos criterios de desempeño están basados en el error acumulativo y se pueden aplicar al seguimiento de trayectorias de referencia indicando el error durante todo el recorrido entre la trayectoria de referencia y la trayectoria real realizada por el robot. Estos índices también son usados para control de posición, distancia, orientación, formación de múltiples robots, etc (Caruntu et al, 2019), (Farias et al, 2020). Entre menor sea el error, mejor será la trayectoria recorrida, en consecuencia, mejor será el algoritmo de control.…”
Section: Error Finalunclassified
See 1 more Smart Citation
“…Estos criterios de desempeño están basados en el error acumulativo y se pueden aplicar al seguimiento de trayectorias de referencia indicando el error durante todo el recorrido entre la trayectoria de referencia y la trayectoria real realizada por el robot. Estos índices también son usados para control de posición, distancia, orientación, formación de múltiples robots, etc (Caruntu et al, 2019), (Farias et al, 2020). Entre menor sea el error, mejor será la trayectoria recorrida, en consecuencia, mejor será el algoritmo de control.…”
Section: Error Finalunclassified
“…Criterio: índice, métrica, medición, procedimiento Referencia % éxito en alcanzar la meta (Gridnev et al, 2017) (Graba et al, 2020) Integral del valor absoluto del error -integral absolute error (IAE) (Fernandes et al, 2017); (Caruntu et al, 2019); (Suarin et al, 2019); (Rivera et al, 2020); (Farias et al, 2020) Integral del valor absoluto del error ponderado en el tiempo -Integral time-weighted absolute error (ITAE) (Fernandes et al, 2017); (Suarin et al, 2019); (Farias et al, 2020) Integral del valor absoluto de la señal de control -Integral absolute signal control (IASC) (Fernandes et al, 2017) Integral del cuadrado del error -integral square error (ISE) (Perez et al, 2018); (Suarin et al, 2019); (Farias et al, 2020) integral del cuadrado del error por el tiempo -Integral time square error (ITSE) (Farias et al, 2020) Esfuerzo de control (Rivera et al, 2020) Seguridad (Marvel and Bostelman, 2014); (Munoz et al, 2014) Energía (Munoz et al, 2014); (Fernandes et al, 2017); (Stefek et al, 2020); (Graba et al, 2020); (Wei and Isler, 2020); (Hrubý et al, 2021)…”
Section: Tbe Se Define Comounclassified
“…In the Q-Learning paradigm, an agent interacts with the environment and executes a set of actions as illustrated by Fig. 4 [15]. However, the update of state-action values in Q-Learning is defined by the following equation [15][17] :…”
Section: System Overviewmentioning
confidence: 99%
“…4 [15]. However, the update of state-action values in Q-Learning is defined by the following equation [15][17] :…”
Section: System Overviewmentioning
confidence: 99%
“…Farias and friends developed an algorithm to control the position of a wheeled mobile robot. The main advantage is learning procedure which is done automatically with recursive procedure [24]. Farias and friends proposed an 3D simulation environment for control the position of a wheeled mobile robot.…”
Section: Introductionmentioning
confidence: 99%