Super Mario Bros. est devenu un terrain d'essai inattendu pour les modèles d'intelligence artificielle. Un groupe de chercheurs du Hao AI Lab, appartenant à l'Université de Californie à San Diego, a réalisé une expérience dans laquelle différentes IA ont été évaluées à l'aide de ce jeu vidéo de plateforme emblématique.
L'expérience visait Analyser la capacité de l'IA à répondre aux stimuli en temps réel. Dans un environnement dynamique et exigeant comme Super Mario Bros., différents modèles ont été mis à l'épreuve pour évaluer leurs performances dans un jeu vidéo classique. Ces types d’expériences peuvent fournir des informations précieuses pour le développement futur de l’intelligence artificielle.
Les meilleurs modèles d'IA testés
Les résultats ont montré des différences significatives entre les modèles évalués. Claude 3.7 d'Anthropic s'est avéré être le plus efficace, surpassant son prédécesseur, Claude 3.5. D'autre part, des modèles largement connus tels que Les GPT-4o d'OpenAI et Gemini 1.5 Pro de Google n'ont pas réussi à offrir des performances exceptionnelles dans ce test. Cela souligne l’importance de poursuivre les recherches et l’évaluation des modèles dans le cadre d’un benchmark de l’IA.
L’un des facteurs qui ont influencé ces résultats était le cadre utilisé. Pour permettre à l'intelligence artificielle d'interagir efficacement avec le jeu, Un framework appelé GamingAgent a été utilisé. Ce logiciel a permis aux modèles d'IA de contrôler plus facilement le personnage dans le jeu via instructions programmées en code Python.
Pourquoi certains modèles ont-ils échoué dans Super Mario Bros. ?
Avec curiosité, Les modèles dotés de capacités de raisonnement complexes ont rencontré des difficultés. Parce que leur traitement est généralement plus lent pour effectuer des calculs détaillés ou prendre des décisions stratégiques, Ces modèles ont montré une réponse moins efficace dans un environnement au rythme rapide comme Super Mario Bros.. Cela pourrait être un domaine à explorer dans de futures expériences, en examinant comment des modèles plus simples peuvent être plus performants.
En revanche, Les intelligences artificielles qui ne dépendent pas de processus de raisonnement profonds étaient plus agiles. Les modèles considérés comme moins avancés ont obtenu des temps de réaction plus courts, leur permettant de mieux s'adapter aux exigences du jeu en temps réel. Ce phénomène pourrait être utile pour analyser des applications dans d’autres contextes, comme dans le développement de jeux vidéo.
Bien que Ce test ne peut pas être considéré comme une référence officielleLes résultats obtenus montrent qu’il existe une nette différence dans les performances des différents modèles d’intelligence artificielle face à des conditions de réponse dynamiques et immédiates.
Ces types d’expériences peuvent fournir des informations précieuses pour le développement futur de l’intelligence artificielle. Analyser la manière dont les modèles réagissent à différents défis pourrait aider à identifier les améliorations dans leur conception et leur application dans différents contextesComme robotique, la automation et les jeux video. En outre, les leçons apprises pourraient être appliquées à d’autres domaines de la technologie et du divertissement, élargissant ainsi leurs horizons.
Il y aura plus de tests comme celui-ci dans d'autres jeux
Ces résultats laissent ouverte la possibilité de réaliser des tests similaires sur d’autres types de jeux vidéo.. Par exemple, dans les jeux de stratégie au tour par tour, les modèles dotés d’un raisonnement plus sophistiqué peuvent être plus performants, en consacrant plus de temps aux décisions stratégiques sans être pénalisés par des temps de réponse prolongés. Cela met en évidence la il faut explorer différents genres et styles de jeu dans les recherches futures.
L'expérimentation avec Super Mario Bros. démontre comment les jeux vidéo peuvent être utilisés pour évaluer l'évolution de intelligence artificielle, offrant un environnement accessible pour mesurer vos capacités et vos limites dans des scénarios interactifs et dynamiques. Bien que toujours, Ce qui nous surprend le plus dans le monde des jeux vidéo, c'est le humain.