-
Notifications
You must be signed in to change notification settings - Fork 2
Open
Labels
Description
Pessoal, acho que está no ponto de definirmos os milestones do projeto.
Como discuti com o Danilo na última reunião, temos que fazer o seguinte:
- Reproduzir exemplos numéricos do PVLV
-- no caso, o PV seria o Rescorla-Wagner, que está disponível na seção docs., e o LV precisamos descobrir como funciona - Escolher o toy-problem para usarmos o pvlv e o q-learning para comparação.
No caso, o pvlv agiria como a parte de aprendizado. Seria importante descobrirmos algum artigo que o utilize em conjunto com seleção de ação.
O danilo enviou para o grupo este artigo reduzido que faz algumas comparações:
http://cal-r.org/mondragon/home/Papers/AISB-1.pdf
Alguém que tenha mais experiência com o github gostaria de me ajudar a organizar as coisas por aqui?