Ver Artigo · Aprendizagem Automática Avançada · Faculdade de Ciências da Universidade de Lisboa

2 Semestre 2022/2023

pt en

Reinforcement learning

15 Maio 2023, 16:30 • Luís Miguel Parreira e Correia

Reinforcement learning

Bellman's dynamic programming

Q-learning

Exploitation v. exploration