NXT Mindstorms e aprendizagem por reforço
A aprendizagem por reforço é uma aprendizagem por tentativa e erro, onde o agente, através da interação com o ambiente, aprende a realizar uma tarefa com base em recompensas positivas e negativas. Esta dissertação pretende analisar o comportamento de um robô implementado com um algoritmo de aprendiz...
Autor principal: | |
---|---|
Formato: | masterThesis |
Idioma: | por |
Publicado em: |
2015
|
Texto completo: | http://hdl.handle.net/10174/12283 |
País: | Portugal |
Oai: | oai:dspace.uevora.pt:10174/12283 |