2018
DOI: 10.1007/s40313-018-0374-y
|View full text |Cite
|
Sign up to set email alerts
|

A Response Surface Model Approach to Parameter Estimation of Reinforcement Learning for the Travelling Salesman Problem

Abstract: This paper reports the use of response surface model (RSM) and reinforcement learning (RL) to solve the travelling salesman problem (TSP). In contrast to heuristically approaches to estimate the parameters of RL, the method proposed here allows a systematic estimation of the learning rate and the discount factor parameters.The Q-learning and SARSA algorithms were applied to standard problems from the TSPLIB library. Computational results demonstrate that the use of RSM is capable of producing better solutions … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
3
1
1

Citation Types

0
30
0
50

Year Published

2019
2019
2023
2023

Publication Types

Select...
5
1

Relationship

2
4

Authors

Journals

citations
Cited by 19 publications
(84 citation statements)
references
References 33 publications
(41 reference statements)
0
30
0
50
Order By: Relevance
“…O modelo de AR definido para a resolução do problema de planejamento de rotas com reabastecimentoé composto por um conjunto de estados (S), ações (A) e reforços (R). A formulação adotadaé baseada em trabalhos anteriores: (Bianchi et al, 2009;Lima Júnior et al, 2010;Ottoni et al, 2018). Após analisar a lógica do problema abordado,é proposta a seguinte estrutura:…”
Section: Sistema De Aprendizado Por Reforçounclassified
See 4 more Smart Citations
“…O modelo de AR definido para a resolução do problema de planejamento de rotas com reabastecimentoé composto por um conjunto de estados (S), ações (A) e reforços (R). A formulação adotadaé baseada em trabalhos anteriores: (Bianchi et al, 2009;Lima Júnior et al, 2010;Ottoni et al, 2018). Após analisar a lógica do problema abordado,é proposta a seguinte estrutura:…”
Section: Sistema De Aprendizado Por Reforçounclassified
“…A metodologia experimental foi baseada em trabalhos recentes: (Ottoni et al, 2018(Ottoni et al, , 2019. As simulações foram realizadas no software M AT LAB R e compreenderam 16 grupos de experimentos (2 algoritmos × 4 instâncias × 2 tipos de problemas):…”
Section: Experimentos Realizadosunclassified
See 3 more Smart Citations