11 September 2006 11:00
Application du Reinforcement Learning à un jeu de Markov de type évasion-poursuite - Where is Ploum ?
by 1 otherCe mémoire étudie le problème évasion-poursuite dans le cas d'un "Markov Decision Process" et dans le cas d'un jeu de Markov. Le problème est ici symbolisé par un ou plusieurs chats cherchant à attraper une souris dans un espace discret torique. La méthode de "Q-Learning" pour résoudre ce problème de "Reinforcement Learning" est étudiée. Il est aussi nécessaire de prévoir une coopération entre les chats afin d'atteindre l'objectif. Une méthode de coopération dite "agent et sous-agents" est développée et testée.
L'implémentation en Python d'un framework généraliste typique pour ce genre de problème est ensuite décrite en détails avec les résultats obtenus pour la méthode de coopération proposée.
09 September 2006 11:00
BAsCET - Wikipédia
(via)BAsCET, acronyme de Blackboard, Agents, Concepts, Exemples et Température, est une architecture d'intelligence artificielle générale fortement inspirée de celle de Copycat.
1
(2 marks)