J.D. Zucker jdzucker ‘chez’ gmail ‘point’ com
Aller là http://www.cs.ubc.ca/~poole/demos/mdp/vi.html
Beaucoup de positions ont l'air symétrique dans le TicTacToe.
Vous trouverez une applet qui permet de comparer un algorithme d'allocation classique et un
algorithme adaptatif qui apprend à allouer des voies à des téléphones cellulaires.
Le site: http://www.eecs.umich.edu/~baveja/Demo.html
a) Liser "A brief explanation"
b) Essayer de modifier les paramètres et de comprendre ce que permet de faire cette applet. Expliquez.
Le site http://lslwww.epfl.ch/~anperez/BlackJack/classes/RLJavaBJ.html permet de jouer au Blackjack.
a) Explorer les différentes possibilités de ce jeux.
b) Trouver un protocole d'expérimentation permettant de montrer qu'il apprend.
c) Analyser le source et modifier le programme pour que le paramètre d'exploration
décroisse en fonction du nombre de parties jouées.
a) Jouer contre la machine
b) Faites apprendre la machine. Rejouer. Que constater vous ?
c) Modifier les paramètres d'apprentissage. En particulier alpha et beta.
d) Examiner le source pour comprendre où se fait l'apprentissage.
e) Modifier le programme pour améliorer l'affichage, charger des paramètres,
ajouter un bouton "réinitialise" si vous connaissez java
D- Aller sur le site http://thierry.masson.free.fr/IA/fr/qlearning_applet.htm
a) Analyser l’applet
b) Essayer de comprendre et « jouez » avec les parametres
E- Aller sur le site : http://www.cse.unsw.edu.au/~cs9417ml/RL1/applet.html
a) Analyser l’applet
b) Essayer de comprendre et « jouez » avec les parametres

http://www.cs.ualberta.ca/~sutton/book/code/code.html
D’autres applet http://www-anw.cs.umass.edu/rlr/domains.html
http://www2.lifl.fr/~decomite/piqle/
Apprentissage Multiagent avec Weka PIQLE : a Platform Implementing Q-LEarning algorithms in JAVA http://sourceforge.net/projects/piqle
http://www2.lifl.fr/~decomite/piqle/