Anthropic prévoit sous peu de lancer un Agentic AI mais afin que le produit final soit réellement opérationnel, il a utilisé un jeu vidéo pour évaluer son nouveau modèle. Que pensez-vous de l’IA d’Anthropic capable de jouer à Pokémon Bleu/Rouge ?
Tel un vrai gamer, ce chatbot a fait face aux mêmes défis que de vrais joueurs et s’en est sorti. Voici ce qu’il en est.
L’IA Anthropic joue à Pokémon sur GameBoy
Est-ce que le fait qu’une IA joue à des jeux vidéo va améliorer ses capacités ? C’est le test que l’entreprise Anthropic essaie de concrétiser à travers Claude 3.7 Sonnet, son IA actualisée qu’ils entraînent a surmonté les mêmes épreuves que Sacha et Pikachu à leurs débuts.
Comment cela s’est passé ? Eh bien, c’est une histoire qui commence en juin 2024. A l’époque, Claude 3.5 Sonnet a été lancé. Mais cette IA n’a pas encore été suffisamment performante afin de terminer des niveaux dans le jeu vidéo Pokémon.
Les réactions de l’IA étaient de réinitialiser la partie ou de trouver tous les moyens d’échapper aux combats difficiles. Mais la version dénommée Claude 3.7 Sonnet a tout changé. Pour la première fois depuis que cette IA joue à ce jeu, elle est parvenue à sortir de Bourg Palette.
Les améliorations apportées à Claude 3.7 Sonnet
L’entreprise l’a équipé d’une meilleure mémoire de base, et d’autres fonctionnalités, ce qui lui a permis de jouer à Pokémon en continu. Selon les personnes qui ont assisté aux progrès de la nouvelle version de l’IA d’Anthropic dans le jeu Pokémon, elle a facilement pu battre Pierre, maître d’arène du Kanto et Ondine par la suite.
Claude 3.7 Sonnet a désormais un mode réflexion. Cette IA sait maintenant comment planifier une stratégie à adopter. Elle sait quels sont les objectifs à atteindre. Puis, elle est en mesure de s’adapter à l’arrivée de problèmes si les méthodes primaires échouent.
Aujourd’hui, on ne sait pas exactement quelle quantité de calcul a été nécessaire à Claude 3.7 Sonnet pour atteindre ces étapes. Sans compter qu’on ne sait pas combien de temps chacune d’entre elles a pris. Mais Anthropic a seulement indiqué que le modèle avait effectué 35 000 actions pour atteindre le dernier niveau du jeu.

Des compétences à appliquer dans d’autres domaines
Au final, si une IA comme celle d’Anthropic a pu terminer le jeu Pokémon par ses propres moyens, elle peut être appliquée dans d’autres domaines afin de résoudre des situations complexes. Ce n’est peut-être pas commun d’être passé par un entraînement à travers un jeu vidéo.
Mais l’expérience a été un succès. Ce qui fait que désormais, l’agentic AI Claude se profile bel et bien à l’horizon. Après tout, si une IA a réussi à donner un nom comme TSUNMAI à son carapuce et à certains Pokémon qu’il a capturés, elle est assez avancée.
- Partager l'article :