Introdução à Aprendizagem por Reforço

6 Dezembro 2019, 09:30 Paulo Jorge Cunha Vaz Dias Urbano

Introdução à Aprendizagem por Reforço. Processos de Decisão de Markov (PDMs) e os seus elementos. Conceito de função valor e de policy. Tarefas episódicas e contínuas. Descontando a recompensa acumulada nas tarefas contínuas. Exemplos de modelização de problemas usandos os PDMs