Quelques mois après son lancement, DeepSeek est déjà à la traîne, talonné de près par la sortie de Gemma 3, l’IA de Google dont le 3ème opus promet du lourd sans trop en faire.
Le développement d’une IA va vite, n’est-ce pas ? Eh bien vous ne croyez pas si bien dire, car Gemma avait à peine été présentée en mai 2024 que maintenant, son successeur est là !
Quelles sont les caractéristiques de Gemma ?
En ayant conçu Gemma 3, Google a cherché à prouver que cette nouvelle version de son IA peut directement être exploitée par les terminaux des utilisateurs. Plus besoin de data centers, votre smartphone peut y avoir accès.
Puis, selon le géant américain, Gemma 3 est capable de raisonner logiquement de manière rapide. Il suffit de lui présenter un texte ou un tableau et l’IA l’analysera. Cette innovation traite les dialogues audio et les documents longs.
Le modèle peut aussi analyser des images et des séquences vidéo courtes. Ensuite, il s’avère que Gemma 3 peut travailler dans 35 langues natives différentes. C’est assez impressionnant vu qu’elle a été entraînée grâce à 140 langues. De ce fait, on peut dire que c’est le meilleur produit de chez Google à ce jour, car on peut l’employer à l’échelle internationale.
Les tâches que Gemma peut accomplir
Officiellement, Gemma 3 peut répondre à des questions sur une image, la comparer avec d’autres afin de trouver ce qui cloche ou d’identifier des objets. C’est mieux que ce que la version précédente avait fait.
Après cela, si vous avez déjà testé le modèle d’origine vous savez que Gemma fonctionne avec des images de 896 x 896 pixels. Mais un nouvel algorithme de fenêtre adaptative est utilisé pour segmenter les images d’entrée. Cela permet à Gemma 3 de travailler avec des images à haute résolution et non carrées.
En quoi Gemma 3 fait mieux que Gemma 2 ?
Comparé à Gemma 2, une seule puce GPU H100 nVidia peut faire tourner Gemma 3. Cela égale les performances de DeepSeek R1. Mais cette nouvelle IA est plus compétitive car ce modèle imite Gemini 2.0 et se décline en plusieurs tailles.
Puis, il s’avère que Gemma 3 utilise le même format de dialogue que Gemma 2. Il n’est donc pas nécessaire de mettre à jour votre IA Google pour passer à la dernière version pour la saisie de texte uniquement. Mais en termes de nouveautés, Gemma 3 fait très bien la différence entre des images combinées avec du texte.
On a 1B, 4B, 12B et 27B. Il y a donc de quoi travailler pour les développeurs. D’ailleurs, ils peuvent en profiter dès à présent sur Google AI Studio. Sinon, cette version est téléchargeable depuis Kaggle ou Hugging Face.

Comment Gemma 3 a été construit ?
Les processus de création de Gemma 3 sont assez simples à comprendre. En fait, cette IA a été optimisée en combinant la distillation, l’apprentissage par renforcement et la fusion de modèles.
C’est un peu comme ce qu’à fait DeepSeek qui s’est inspiré de l’ancien code de chatGPT d’OpenAI pour être créé. Cette approche a alors permis d’améliorer les performances en mathématiques, en codage et en suivi des instructions de cette IA.
- Partager l'article :