NXT e Aprendizagem por Reforço
A aprendizagem por reforço é uma aprendizagem por tentativa e erro, onde o agente, através da interacção com o ambiente, aprende a realizar uma tarefa com base em recompensas positivas e negativas. Este artigo pretende analisar o comportamento de um robô implementado com um sistema de aprendizagem p...
Main Author: | |
---|---|
Other Authors: | |
Format: | article |
Language: | por |
Published: |
2012
|
Subjects: | |
Online Access: | http://hdl.handle.net/10174/4526 |
Country: | Portugal |
Oai: | oai:dspace.uevora.pt:10174/4526 |