Métodos de Monte Carlo na Aprendizagem por Reforço

16 Dezembro 2019, 09:30 Paulo Jorge Cunha Vaz Dias Urbano

Aprendizagem por reforço quando não se conhece o modelo (model-free).


Estimando através de Monte Carlo para tarefas episódicas
Estimando o valor dos estados dada uma policy
Cálculo da policy ótima (iteração da policy) com Monte Carlo