2017
DOI: 10.5335/rbca.v9i3.6601
|View full text |Cite
|
Sign up to set email alerts
|

Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional

Abstract: Resumo: Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Problema da Mochila Multidimensional. Para isso, é proposto um modelo de Aprendizado por Reforço estruturado em estados, ações e recompensas. Além disso, os experimentos computacionais apresentados permitem analisar a sensibilidade dos parâmetros do algoritmo Q-learning na resolução desse tipo de problema de otimização combinatória. Palavras-chave:Aprendizado por Reforço. Otimização Combinatória. Problema da Moc… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
1
0
11

Year Published

2020
2020
2023
2023

Publication Types

Select...
3
1

Relationship

1
3

Authors

Journals

citations
Cited by 4 publications
(12 citation statements)
references
References 17 publications
0
1
0
11
Order By: Relevance
“…Aárea de otimização combinatóriaé um campo com vários estudos com AR (Gambardella and Dorigo, 1995;Bianchi et al, 2009;Lima Júnior et al, 2010;Costa et al, 2016;Alipour et al, 2018;Lins et al, 2019). Nesse aspecto, alguns domínios com aplicações de técnicas de AR são: Problema do Caxeiro Viajante (TSP) (Gambardella and Dorigo, 1995;Lima Júnior et al, 2010), Problema dos K-Servos (Costa et al, 2016;Lins et al, 2019), Problema da Mochila Multidimensional (Ottoni et al, 2017), Roteamento de Veículos (Silva et al, 2019) e Sequential Ordering Problem (SOP) (Ottoni et al, 2020).…”
Section: Seguindo Essa Linha Técnicas De Transfer Reinforcementunclassified
“…Aárea de otimização combinatóriaé um campo com vários estudos com AR (Gambardella and Dorigo, 1995;Bianchi et al, 2009;Lima Júnior et al, 2010;Costa et al, 2016;Alipour et al, 2018;Lins et al, 2019). Nesse aspecto, alguns domínios com aplicações de técnicas de AR são: Problema do Caxeiro Viajante (TSP) (Gambardella and Dorigo, 1995;Lima Júnior et al, 2010), Problema dos K-Servos (Costa et al, 2016;Lins et al, 2019), Problema da Mochila Multidimensional (Ottoni et al, 2017), Roteamento de Veículos (Silva et al, 2019) e Sequential Ordering Problem (SOP) (Ottoni et al, 2020).…”
Section: Seguindo Essa Linha Técnicas De Transfer Reinforcementunclassified
“…A definic ¸ão de parâmetros do AR é um ponto importante para um bom desempenho nos experimentos [14], [17], [11]. A taxa de aprendizado (α) regula a velocidade que as novas informac ¸ões aprendidas se sobrepõem perante as antigas.…”
Section: A Aprendizado Por Reforc ¸Ounclassified
“…A estrutura de AR adotada foi proposta em [17]. No modelo, um estado identifica qual item i é inserido nas m mochilas no instante t. As ac ¸ões representam a intenc ¸ão de inserir um objeto i em t+1.…”
Section: Problema Da Mochila Multidimensionalunclassified
See 1 more Smart Citation
“…Já o trabalho [9], define os parâmetros α e γ por tentativa e erro para um ambiente de navegação simulada. Em uma publicação recente dos autores deste trabalho, é avaliado o desempenho do algoritmo Q-learning na solução do Problema do Caixeiro Viajante, verificando os resultados da variação da polítca ε-greedy e da taxa de aprendizado [10]. Ainda na literatura, o método mais simples e muito utilizado é a definição dos parâmetros α e γ constantes em um única combinação inicial, como nos trabalhos [11] [12] [13] [14] [15].…”
Section: Introductionunclassified