Ver Artigo · Introdução à Inteligência Artificial · Faculdade de Ciências da Universidade de Lisboa

16 Dezembro 2019, 09:30 • Paulo Jorge Cunha Vaz Dias Urbano

Aprendizagem por reforço quando não se conhece o modelo (model-free).

Estimando através de Monte Carlo para tarefas episódicas

Estimando o valor dos estados dada uma policy

Cálculo da policy ótima (iteração da policy) com Monte Carlo