NXT Mindstorms e aprendizagem por reforço

A aprendizagem por reforço é uma aprendizagem por tentativa e erro, onde o agente, através da interação com o ambiente, aprende a realizar uma tarefa com base em recompensas positivas e negativas. Esta dissertação pretende analisar o comportamento de um robô implementado com um algoritmo de aprendiz...

ver descrição completa

Detalhes bibliográficos
Autor principal: Coelho, João Paulo Carracha (author)
Formato: masterThesis
Idioma:por
Publicado em: 2015
Texto completo:http://hdl.handle.net/10174/12283
País:Portugal
Oai:oai:dspace.uevora.pt:10174/12283