Mesurez-vous à notre intelligence artificielle sur Puissance 4

Vous voulez en savoir plus ? Consultez le blog technique de Sicara !

Cette intelligence artificielle s’est entraînée seule en jouant contre elle-même. L’algorithme mis en place est le Q-learning, qui consiste à apprendre par le jeu : la valeur d’un coup par rapport à l’environnement de jeu est estimée au fil des parties.

Dans le cas de jeux simples, cette fonction “valeur” peut-être calculée de manière exacte. Pour les jeux aux possibilités indénombrables, elle doit être approchée : c’est ici le rôle des réseaux de neurones. Nous avons développé deux approches :

Le réseau de neurones “Dense Challenger” est un réseau dense, dans le sens où toutes les cases du puissance 4 sont directement prises en compte pour calculer le prochain coup.

Le réseau de neurones “Convolution King” est un réseau de convolution. Ce réseau utilisent des filtres qui parcourent les cases pour faire ressortir des motifs et prendre des décisions en conséquence.

Ces deux réseaux de neurones apprennent lorsqu’ils perdent. L’exécution du code est réalisée dans votre navigateur. Mais les données ne sont pas récupérées pour entraîner un réseau unique. Pas de craintes, vos défaites ne sont donc pas enregistrées !