“…O Aprendizado por Reforço está associado a questão na qual o agente deve aprender comportamentos onde não exista um auxílio externo, utilizando somente as iterações de tentativa e erro em um ambiente dinâmico. Baseado na idéia que, se uma ação é seguida de estados satisfatórios, ou por uma melhoria no estado, então a tendência para produzir esta ação é aumentada, isto é, reforçada (Faria, 2000).…”