Sumários
Calculando a policy óptima: Iteração valor e iteração da policy
13 Dezembro 2019, 09:30 • Paulo Jorge Cunha Vaz Dias Urbano
Técnicas para planear a melhor policy (conhecendo o modelo do meio-ambiente):
- Iteração do Valor
- Iteração da Policy
Data mining em Orange
12 Dezembro 2019, 12:00 • Helena Aidos
K-NN e Random forests em orange. Avaliação dos modelos para os diferentes parâmetros.
Exercícios.
Data mining em Orange
11 Dezembro 2019, 11:30 • Paulo Jorge Cunha Vaz Dias Urbano
K-NN e Random forests em orange
Data mining em Orange
9 Dezembro 2019, 11:30 • Paulo Jorge Cunha Vaz Dias Urbano
K-NN e Random forests em orange
Avaliando os processos de Decisão de Markov para uma policy fixa
9 Dezembro 2019, 09:30 • Paulo Jorge Cunha Vaz Dias Urbano
- Processos de decisão de Markov, o formalismo para lidar com problemas de sequências de decisões com incerteza.
- Resolução de MDPs, cálculo da utilidade esperada (função valor) dado uma policy, usando um sistema linear de equações e a programação dinâmica