Avaliando os processos de Decisão de Markov para uma policy fixa

9 Dezembro 2019, 09:30 Paulo Jorge Cunha Vaz Dias Urbano

  • Processos de decisão de Markov, o formalismo para lidar com problemas de sequências de decisões com incerteza.
  • Resolução de MDPs, cálculo da utilidade esperada (função valor) dado uma policy, usando um sistema linear de equações e a programação dinâmica