NXT Mindstorms e aprendizagem por reforço
A aprendizagem por reforço é uma aprendizagem por tentativa e erro, onde o agente, através da interação com o ambiente, aprende a realizar uma tarefa com base em recompensas positivas e negativas. Esta dissertação pretende analisar o comportamento de um robô implementado com um algoritmo de aprendiz...
Main Author: | |
---|---|
Format: | masterThesis |
Language: | por |
Published: |
2015
|
Online Access: | http://hdl.handle.net/10174/12283 |
Country: | Portugal |
Oai: | oai:dspace.uevora.pt:10174/12283 |