2012 Brazilian Robotics Symposium and Latin American Robotics Symposium 2012
DOI: 10.1109/sbr-lars.2012.35
|View full text |Cite
|
Sign up to set email alerts
|

A Proposal of QLearning to Control the Attack of a 2D Robot Soccer Simulation Team

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
3
1

Citation Types

0
1
0
5

Year Published

2014
2014
2020
2020

Publication Types

Select...
4
2

Relationship

0
6

Authors

Journals

citations
Cited by 6 publications
(6 citation statements)
references
References 3 publications
0
1
0
5
Order By: Relevance
“…Ennek eléréséhez természetesen még rengeteg kutatási munka várat magára. Ellenben számos különböző megoldás született már a RoboCup versenyre, a legkülönfélébb mesterséges intelligencia módszerek alkalmazásával (lásd többek között: [14], [15], [20], [23], [24] és [25]).…”
Section: Bevezetésunclassified
See 2 more Smart Citations
“…Ennek eléréséhez természetesen még rengeteg kutatási munka várat magára. Ellenben számos különböző megoldás született már a RoboCup versenyre, a legkülönfélébb mesterséges intelligencia módszerek alkalmazásával (lásd többek között: [14], [15], [20], [23], [24] és [25]).…”
Section: Bevezetésunclassified
“…A [14]-ben bemutatott megoldás például megerősítéses tanulást alkalmaz, hogy feltárja azokat az alapvető képességeket, amelyek ahhoz szükségesek, hogy egy ágens megszerezze a labdát. Egy másik megközelítés [15], szintén megerősítéses tanulást, a Q-learning egy változatát használja. Itt a cél annak a tudásnak a feltérképezése, hogy mikor melyik akciót (passzolás, elrúgás, cselezés) érdemes az ágensnek végrehajtania a korábban felhalmozott tapasztalatok figyelembe véve.…”
Section: Bevezetésunclassified
See 1 more Smart Citation
“…Um outro método com vasta aplicação na robótica e no ambiente simulado de futebol de robôs 2Dé o Aprendizado por Reforço (AR) (Bianchi, 2004;Martins, 2007;Neri et al, 2012;Ottoni et al, 2015). Seu processo de aprendizagem, consiste em aplicar reforços (penalidades ou recompensas) ao agente, buscando otimizar seu comportamento (ações) nas diferentes situações do ambiente (estados) (Kaelbling et al, 1996;Sutton and Barto, 2018).…”
Section: Introductionunclassified
“…Stone's KeepAway task [29] is a good example of an RL application to develop team-level naive attacking strategies. The work inspired other researchers to develop more agressive attacking strategies based on reinforcement learning [12,14].…”
mentioning
confidence: 96%