Métodos de Monte Carlo na Aprendizagem por Reforço
16 Dezembro 2019, 09:30 • Paulo Jorge Cunha Vaz Dias Urbano
Aprendizagem por reforço quando não se conhece o modelo (model-free).
Estimando através de Monte Carlo para tarefas episódicas
Estimando o valor dos estados dada uma policy
Cálculo da policy ótima (iteração da policy) com Monte Carlo