Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis

Faria, Gedson; Romero, Roseli Francelin

doi:10.11606/d.55.2020.tde-19022020-091603

Cited by 1 publication

(18 citation statements)

References 5 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…Muitos tipos diferentes de paradigmas de aprendizado podem ser encontrados na literatura. (Mitchell, 1997;Faria, 2000).…”

Section: Contexto E Motivaçãounclassified

“…As recompensas que o agente espera receber, depende das ações que ele escolherá. Deste modo, funções de custo são definidas de acordo com políticas particulares (Faria, 2000).…”

Section: Encontrarunclassified

“…Considere o problema: para uma dada política de ação fixa π, como é possível calcular por simulação -i.e., sem a ajuda de PD -a função de avaliação V π ? A solução mais simples é executar muitas trajetórias simuladas para cada estado e calcular a média aritmética dos reforços acumulados obtidos, ou seja, uma simulação de Monte Carlo (Faria, 2000).…”

Section: Programção Dinâmica E Método De Monte Carlounclassified

“…O Aprendizado por Reforço está associado a questão na qual o agente deve aprender comportamentos onde não exista um auxílio externo, utilizando somente as iterações de tentativa e erro em um ambiente dinâmico. Baseado na idéia que, se uma ação é seguida de estados satisfatórios, ou por uma melhoria no estado, então a tendência para produzir esta ação é aumentada, isto é, reforçada (Faria, 2000).…”

Section: Introductionunclassified

“…A técnica de DT parte da idéia de propagar o reforço pelo tempo, assim, os estados que foram visitados anteriormente e que conduziram a esta condição, serão associados a uma predição de conseqüências futuras. Isto está baseado em uma suposição importante em processos dinâmicos, chamada Processo de Decisão de Markov (PDM) (Faria, 2000).…”

Section: Introductionunclassified

See 4 more Smart Citations

Aprendizado por reforço relacional para o controle de robôs sociáveis

Silva¹

View full text Add to dashboard Cite

“…Muitos tipos diferentes de paradigmas de aprendizado podem ser encontrados na literatura. (Mitchell, 1997;Faria, 2000).…”

Section: Contexto E Motivaçãounclassified

“…As recompensas que o agente espera receber, depende das ações que ele escolherá. Deste modo, funções de custo são definidas de acordo com políticas particulares (Faria, 2000).…”

Section: Encontrarunclassified

Section: Programção Dinâmica E Método De Monte Carlounclassified

Section: Introductionunclassified

See 3 more Smart Citations

Aprendizado por reforço relacional para o controle de robôs sociáveis

Silva¹

View full text Add to dashboard Cite

Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis

Cited by 1 publication

References 5 publications

Aprendizado por reforço relacional para o controle de robôs sociáveis

Aprendizado por reforço relacional para o controle de robôs sociáveis

Contact Info

Product

Resources

About