Calculando a policy óptima: Iteração valor e iteração da policy

13 Dezembro 2019, 09:30 Paulo Jorge Cunha Vaz Dias Urbano

Técnicas para planear a melhor policy (conhecendo o modelo do meio-ambiente):

  • Iteração do Valor
  • Iteração da Policy