Aprendizado da coordenação de comportamentos primitivos para robôs móveis

Selvatici, Antonio Henrique Pinto; Costa, Anna Helena Reali

doi:10.1590/s0103-17592007000200004

Cited by 5 publications

(7 citation statements)

References 9 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…The actively controlled devices perform their actions according to predetermined schedules; semi-actively or passively controlled devices reflect the physical movement of the controller, minimizing or maximizing the strength and range, allowing to perform actions that would be impossible without this aid. Moreover, are already available robots with locomotive capacity to develop reactive behaviors, for example obstacles, and build an evolutionary learning to adapt to different environments, whose refinement could produce important advances in robotics 26 .…”

Section: Resultsmentioning

confidence: 99%

Robotic Surgery: Bioethical Aspects

Siqueira-Batista

Souza

Maia

et al. 2016

ABCD, arq. bras. cir. dig.

View full text Add to dashboard Cite

Introduction: The use of robots in surgery has been increasingly common today, allowing the emergence of numerous bioethical issues in this area. Objective: To present review of the ethical aspects of robot use in surgery. Method: Search in Pubmed, SciELO and Lilacs crossing the headings "bioethics", "surgery", "ethics", "laparoscopy" and "robotic". Results: Of the citations obtained, were selected 17 articles, which were used for the preparation of the article. It contains brief presentation on robotics, its inclusion in health and bioethical aspects, and the use of robots in surgery. Conclusion: Robotic surgery is a reality today in many hospitals, which makes essential bioethical reflection on the relationship between health professionals, automata and patients.

show abstract

Section: Resultsmentioning

confidence: 99%

Robotic Surgery: Bioethical Aspects

Siqueira-Batista

Souza

Maia

et al. 2016

ABCD, arq. bras. cir. dig.

View full text Add to dashboard Cite

show abstract

“…Conforme [11], reforços intermediários são importantes para acelerar o aprendizado, no entanto, esses reforços devem ter valores inferiores aquele recebido quando o robô atinge o alvo.…”

Section: R(s A)unclassified

“…Em uma publicação recente dos autores deste trabalho, é avaliado o desempenho do algoritmo Q-learning na solução do Problema do Caixeiro Viajante, verificando os resultados da variação da polítca ε-greedy e da taxa de aprendizado [10]. Ainda na literatura, o método mais simples e muito utilizado é a definição dos parâmetros α e γ constantes em um única combinação inicial, como nos trabalhos [11] [12] [13] [14] [15].…”

Section: Introductionunclassified

Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma

Ottoni

Nepomuceno

Oliveira

et al. 2016

RBCA

View full text Add to dashboard Cite

Resumo: Nos algoritmos de aprendizado por reforço, a taxa de aprendizado (α) e o fator de desconto (γ) podem ser definidos entre qualquer valor no intervalo entre 0 e 1. Assim, adotando os conceitos de regressão logística, é proposta uma metodologia estatística para a análise da influência da variação de α e γ nos algoritmos Q-learning e SARSA. Como estudo de caso, o aprendizado por reforço foi aplicado em experimentos de navegação autônoma. A análise de resultados mostrou que simples variações em α e γ podem interferir diretamente no desempenho do aprendizado por reforço. Palavras IntroduçãoA técnica de aprendizado por reforço (AR) é amplamente aplicada na robótica para resolução de diferentes problemas e situações [1]. O objetivo do AR é fazer com que um agente possa aprender a tomar decisões a partir de experiências de sucesso e fracasso no ambiente.

show abstract

“…Dessa forma, o objetivo de "marcar um gol" pode ser desmembrado em "obter posse de bola", "driblar em direçãoà meta" e "chutar em direção ao gol". Reforços intermediários são importantes para acelerar o aprendizado, no entanto, esses reforços devem ter valores inferioresàquele recebido quando o robô atinge o alvo [7].…”

Section: Definição Da Matriz De Recompensas Imediatasunclassified

“…Desde a elaboração do Q-learning, pesquisas e publicações vem propondo diferentes aplicações e análises para o AR. Robótica móvel [7], otimização na produção de petróleo [8], tráfego aéreo [9] e controleótimo de descarregadores de navios [10] são alguns exemplos de aplicações do AR encontrados na literatura. Outras pesquisas atuam na linha de tentar diminuir o tempo gasto para convergência dos algoritmos de AR.…”

Section: Introductionunclassified

Análise do Aprendizado por Reforço Aplicado a Otimização em Tomadas de Decisões Multiagente

Ottoni¹,

Nepomuceno²,

Oliveira³

et al. 2016

Anais Do 11. Congresso Brasileiro De Inteligência Computacional

View full text Add to dashboard Cite

O objetivo deste trabalho foi aplicar e analisar os efeitos do aprendizado por reforço na otimização de tomadas decisões de um sistema multiagente cooperativo.É apresentada uma metodologia de modelagem da técnica de aprendizado por reforço para times de futebol de robôs 2D. A implementação da estratégia de aprendizagem consistiu de quatro etapas: definição das ações dos agentes; definição dos estados do ambiente no qual os agentes estão inseridos; definição dos valores dos reforços; implementação no simulador RcSoccerSim da Robocup de futebol de robôs. Os testes estatísticos foram utilizados para verificar o comportamento do time de robôs durante todo o processo de aprendizado. A análise se deu verificando a evolução de desempenho do sistema multiagente como um todo, através de estudos do saldo de gols alcançado em cada jogo. Além disso, a performance individual de cada agente também foi quantificada. Através dos testes de análise de variância e comparações múltiplas foi possível quantificar quais agentes sofreram alterações de performance ao longo do processo de otimização.

show abstract

Aprendizado da coordenação de comportamentos primitivos para robôs móveis

Cited by 5 publications

References 9 publications

Robotic Surgery: Bioethical Aspects

Robotic Surgery: Bioethical Aspects

Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma

Análise do Aprendizado por Reforço Aplicado a Otimização em Tomadas de Decisões Multiagente

Contact Info

Product

Resources

About