Sumários

Calculando a policy óptima: Iteração valor e iteração da policy

13 Dezembro 2019, 09:30 Paulo Jorge Cunha Vaz Dias Urbano

Técnicas para planear a melhor policy (conhecendo o modelo do meio-ambiente):

  • Iteração do Valor
  • Iteração da Policy 


Data mining em Orange

12 Dezembro 2019, 12:00 Helena Aidos

K-NN e Random forests em orange. Avaliação dos modelos para os diferentes parâmetros.

Exercícios.


Data mining em Orange

11 Dezembro 2019, 11:30 Paulo Jorge Cunha Vaz Dias Urbano

K-NN e Random forests em orange

Avaliação dos modelos para os diferentes parâmetros
Exemplos


Data mining em Orange

9 Dezembro 2019, 11:30 Paulo Jorge Cunha Vaz Dias Urbano

K-NN e Random forests em orange

Avaliação dos modelos para os diferentes parâmetros
Exemplos


Avaliando os processos de Decisão de Markov para uma policy fixa

9 Dezembro 2019, 09:30 Paulo Jorge Cunha Vaz Dias Urbano

  • Processos de decisão de Markov, o formalismo para lidar com problemas de sequências de decisões com incerteza.
  • Resolução de MDPs, cálculo da utilidade esperada (função valor) dado uma policy, usando um sistema linear de equações e a programação dinâmica