Blogmarks : Public marks from fredbird with tags ia & programming

11 September 2006 11:00

Application du Reinforcement Learning à un jeu de Markov de type évasion-poursuite - Where is Ploum ?

by 1 other

Ce mémoire étudie le problème évasion-poursuite dans le cas d'un "Markov Decision Process" et dans le cas d'un jeu de Markov. Le problème est ici symbolisé par un ou plusieurs chats cherchant à attraper une souris dans un espace discret torique. La méthode de "Q-Learning" pour résoudre ce problème de "Reinforcement Learning" est étudiée. Il est aussi nécessaire de prévoir une coopération entre les chats afin d'atteindre l'objectif. Une méthode de coopération dite "agent et sous-agents" est développée et testée. L'implémentation en Python d'un framework généraliste typique pour ce genre de problème est ensuite décrite en détails avec les résultats obtenus pour la méthode de coopération proposée.

ia lang:fr programming

09 September 2006 11:00

BAsCET - Wikipédia

(via)

BAsCET, acronyme de Blackboard, Agents, Concepts, Exemples et Température, est une architecture d'intelligence artificielle générale fortement inspirée de celle de Copycat.

lang:fr programming bot ia

1 (2 marks)

PUBLIC MARKS from fredbird with tags ia & programming

11 September 2006 11:00

Application du Reinforcement Learning à un jeu de Markov de type évasion-poursuite - Where is Ploum ?

09 September 2006 11:00

BAsCET - Wikipédia

fredbird's TAGS related to tag ia

Blogmarks.net is a social bookmarking service.

Already an user?

PUBLIC MARKS from fredbird with tags ia & programming

11 September 2006 11:00

Application du Reinforcement Learning à un jeu de Markov de type évasion-poursuite - Where is Ploum ?

09 September 2006 11:00

BAsCET - Wikipédia

fredbird's TAGS related to tag ia