Afin de mieux appréhender le passé, le présent ou le futur, ByteDance, la société mère de TikTok, a récemment lancé Omnihuman, une IA que tout le monde connaît de nom. Mais en quoi consiste-t-elle réellement ?
Dans un monde où l’IA évolue à une vitesse fulgurante, cette technologie génératrice de vidéos permet de créer des vidéos très réalistes à partir d’une simple photographie. Si bien que cela repousse les limites de ce que les derniers modèles d’IA peuvent accomplir dans le domaine des médias visuels.
Comment l’IA Omnihuman a été conçue via Tik Tok ?
Dans le monde actuel, tout le monde connaît Tik Tok. Mais très peu de gens connaissent ByteDance, le géant derrière cette plateforme populaire. Et pourtant, c’est grâce à eux qu’elle existe. Or, ces temps, il faut dire que cette entreprise se démarque en ayant développé Omnihuman, l’IA de ByteDance qui s’entraîne sur des données de Tik Tok.
Les origines de cette énième IA sont donc faciles à retracer. Mais ce qu’il faut savoir c’est qu’elle a été créée dans le but de permettre à l’entreprise d’entrer dans l’ère de l’innovation. Alors que les géants américains sont toujours sur le devant de la scène en matière d’IA, la Chine les rattrape.
On a récemment connu le succès de DeepSeek. Et maintenant, on a Omnihuman qui est une IA construite sur un ensemble de données étendu. Elle a été formée pendant plus de 18 700 heures de données de mouvement humain. Ce sont ces données qui lui permettent de générer des vidéos qui capturent les différentes expressions humaines et le mouvement du corps humain.
Pourquoi l’a-t-on appelé Omnihuman ?
Le nom « Omnihuman » reflète l’aptitude de cette IA de ByteDance entraînée à coup de vidéos Tik Tok à créer des contenus englobant une large gamme d’activités humaines. Cela peut aller de la parole et du chant à la danse et aux gestes.
Son nom n’a donc aucune connotation de près ou de loin avec Omniman, qui est un personnage du comic « Invincible ». Il est certes très fort et englobe certainement mieux les qualités de l’homme-alien surpuissant par rapport à Superman. Mais cela n’a rien à voir, fin de cette parenthèse.
C’est fait pour qui ?
Omnihuman est un outil puissant pour les créateurs de contenu. Il est fait pour les entreprises qui doivent être à fonds dans le domaine du marketing. Sinon, c’est une IA qui est faite pour les utilisateurs quotidiens cherchant à produire du contenu vidéo attractif avec un minimum d’effort.
Cette polyvalence positionne donc cet outil dans le top des dispositifs à employer si vous devez rapidement amuser la galerie. Par exemple, en prenant en photo le petit personnage en forme de tomate sur la boîte de conserve que vous avez devant vous, cela peut donner la vidéo amusante d’une tomate dansante qui sort du cadre dans lequel on l’a dessiné.
Fonctionnement de cette IA
Au cœur d’Omnihuman il y a des algorithmes d’apprentissage automatique avancés. Ils sont chargés d’analyser et d’interpréter l’image d’entrée. Puis, l’IA décompose alors le cliché en caractéristiques. L’IA décortique les expressions faciales que le personnage en question peut adopter, la posture du corps qu’il peut prendre et même le faire bouger dans l’environnement qui l’entoure. Grâce à l’ensemble de ces éléments, Omnihuman peut produire une vidéo qui feint le mouvement et les schémas de parole humains naturels.

Les créations d’Omnihuman, bonnes ou mauvaises ?
En effet, étant donné que l’IA génère un audio et une vidéo synchronisés qui semblent organiques, elle produit des représentations authentiques d’individus. Qu’avez-vous pensez de la vidéo d’Einstein qui vous parle en direct ?
Pour ma part, je dois dire qu’en ayant vu le nombre de vues de ce contenu, ce fut un vrai succès auprès des internautes qui l’ont vu. De ce fait, on peut considérer que cette IA peut être employée à bon escient et à mauvais escient.
En effet, on peut dire qu’Omnihuman peut parfaitement créer des deepfakes à un niveau professionnel. Peut-être même qu’actuellement les faiseurs de fake trailers l’emploie également. Ce qui n’est pas une bonne nouvelle, car on peut faire dire ce qu’on veut au personnage sur la photo donnée si le prompt est bien écrit.
Domaines d’applications possibles
Par contre, en y réfléchissant bien, cette technologie pourrait avoir un impact significatif dans les domaines suivants :
L’Éducation et la Formation :
Les éducateurs peuvent utiliser Omnihuman pour créer des séances de cours interactifs prodigués par les visages des personnages historiques eux-même qu’on a animé grâce à l’IA. Imaginez une leçon d’histoire où une figure célèbre raconte sa propre histoire. Cela la rendrait plus vivante.
Les Médias Sociaux :
Avec la montée en puissance de plateformes comme TikTok, l’IA de ByteDance Omnihuman pourrait révolutionner la manière dont les utilisateurs partagent leurs stories. Au lieu de formats vidéo traditionnels, les utilisateurs pourraient créer des vidéos dynamiques et personnalisées qui captent mieux l’attention dans un espace numérique saturé. C’est comme mettre en scène une pièce de théâtre, mais seul.
Le Divertissement :
Pour suivre, c’est dans l’industrie du film et de la télévision qu’Omnihuman peut concevoir des animations de personnages. Mais dans ce domaine, il va peut-être falloir faire attention, car certaines réalisations utilisant des visages humains créent actuellement la polémique.
Si on peut ressusciter des figures historiques pour des documentaires, on peut également leur faire dire n’importe quoi. Et c’est pareil avec les visages des acteurs ou des politiciens actuels. Les possibilités de narration sont indéfinies.
Le souci des considérations Éthiques
Après l’énumération des domaines dans lesquels cette « AI made by ByteDance » est utilisable, il s’avère que les capacités d’Omnihuman soulèvent également d’importantes questions éthiques.
Bien qu’elles soient impressionnantes, la capacité de créer des vidéos réalistes à partir d’une seule image pourrait conduire à des abus. C’est le cas en particulier dans le domaine de la désinformation et des deepfakes.
Comme nous l’avons vu ces dernières années, la prolifération de médias manipulés a le potentiel de déformer la réalité et d’influencer l’opinion publique. C’est très dangereux, car cela peut conduire à des conflits ou en alimenter d’autres.
ByteDance a reconnu ces préoccupations. Il est dit que l’entreprise mettrait en œuvre des mesures pour atténuer les risques associés à Omnihuman. Cela inclut le filigrane des vidéos générées et la fourniture de directives aux utilisateurs sur une utilisation éthique. Cependant, la responsabilité incombe finalement aux utilisateurs. C’est à eux de s’assurer que la technologie est utilisée à des fins positives et constructives.
L’Avenir de la Génération Vidéo
L’introduction de l’IA de ByteDance Omnihuman n’est qu’un début. À mesure que l’IA continue d’évoluer, nous pouvons nous attendre à ce que des outils encore plus sophistiqués soient inventés. Certains brouilleront de plus en plus les frontières entre la réalité et la création numérique.
De ce fait, le défi sera de naviguer dans ce nouveau paysage de manière réfléchie. La génération actuelle et future devra veiller à ce que la technologie serve à améliorer nos vies plutôt qu’à les compliquer.
Omnihuman de ByteDance est un véritable concurrent de taille dans le monde de la génération de vidéos. En exploitant la puissance de l’IA, l’entreprise a créé un outil qui démocratise la création de contenu. Il est accessible à quiconque possède une photo et une histoire à raconter. Alors que nous adoptons cette nouvelle technologie, il est crucial de rester vigilants quant aux implications éthiques et de s’efforcer d’un avenir où l’IA améliore notre créativité sans compromettre nos valeurs.

Résumé des points généraux concernant Omnihuman
Au final, alors qu’Omnihuman entre sur le marché, il est prêt à changer le paysage de la génération vidéo. Arrivée derrière VEO 2 de Google et Sora d’OpenAI, cette nouvelle IA générative se distingue comme un développement significatif dans le domaine de l’audiovisuel. Elle pourrait redéfinir la création de contenu, le divertissement et même notre perception de la réalité.
C’est une technologie qui représente certes un bond en avant significatif dans les capacités de l’IA, mais son usage ne doit pas être détourné dans le but de nuire à autrui.
En effet, la création de contenus visuels via cette IA est tellement convaincante pour les individus et les entreprises, qu’ils l’emploient tous. Et tout ce beau monde doit pouvoir garantir un développement et une utilisation responsables de l’IA.
- Partager l'article :