10 Maio 2018, 16:30 • Luís Miguel Parreira e Correia
Dynamic programmingReinforcement learningQ-learning