Avaliando os processos de Decisão de Markov para uma policy fixa
9 Dezembro 2019, 09:30 • Paulo Jorge Cunha Vaz Dias Urbano
- Processos de decisão de Markov, o formalismo para lidar com problemas de sequências de decisões com incerteza.
- Resolução de MDPs, cálculo da utilidade esperada (função valor) dado uma policy, usando um sistema linear de equações e a programação dinâmica