Ver Artigo · Introdução à Inteligência Artificial · Faculdade de Ciências da Universidade de Lisboa

Introdução à Aprendizagem por Reforço

6 Dezembro 2019, 09:30 • Paulo Jorge Cunha Vaz Dias Urbano

Introdução à Aprendizagem por Reforço. Processos de Decisão de Markov (PDMs) e os seus elementos. Conceito de função valor e de policy. Tarefas episódicas e contínuas. Descontando a recompensa acumulada nas tarefas contínuas. Exemplos de modelização de problemas usandos os PDMs