Open AI, créateur de Chat GPT, se lance dans le domaine de la vidéo entièrement réalisée par l’intelligence artificielle. Les premières démonstrations disponibles sur leurs réseaux sont impressionnantes. Mais, au-delà de l’exploit technique, c’est tout un pan de l’industrie du divertissement qui s’interroge sur son devenir.
La présentation du générateur de vidéo Sora par OpenAI – les créateurs de Chat GPT -, jeudi 15 février, a été tellement impressionnante qu’elle a réussi à occulter la sortie de Gemini, le nouvel assistant IA successeur de Google Bard ou V-JEPA, un modèle non-génératif pour créer des vidéos pensé par Meta…
Sans aucun doute, la date de présentation a été mûrement réfléchie et Open AI avait ce jour-là décidé d’écraser la concurrence. En ce début d’année 2024 où les évolutions de l’IA tâtonnent encore, on est tout autant dans la démonstration technique que dans les stratégies marketing.
Techniquement, justement, qu’est-ce que Sora ? « C’est un chat GPT de la vidéo », résume Benoît Raphaël dans Generation IA. C’est-à-dire qu’avec un ensemble d’instructions, au format texte, (on parle de prompt pour ce langage codé avec la machine), on obtient une vidéo. Les exemples présentés par OpenAI sont bluffants, le prompt s’avère contenir un véritable scénario pour produire une scène courte. Sora utilise les mêmes technologies que les modèles de génération d’images comme Stable diffusion, Midjourney ou Dall E3 où l’image est générée pixel par pixel. Pour la vidéo, on parle de « patchs spatio-temporels ».
Jim Fan, chercheur IA chez Nvidia, leader sur le marché des micro-processeurs, anticipe même que Sora pourrait devenir à terme un simulateur de monde.
Unmute. Sora now gets synthetic audio @elevenlabsio. It’s prompted by text, but the right conditioning should be on both text and video pixels. Learning an accurate video->audio mapping would also require modeling some *implicit* physics in the latent space.
Here’s what an… pic.twitter.com/HjCXh7zb30
— Jim Fan (@DrJimFan) February 18, 2024
Autant d’avancées, de promesses et de craintes qui amènent le monde du cinéma, de l’animation ou des youtubeurs à réagir. « L’évolution de la technique a toujours existé, explique Laurent Nicolas, dessinateur et réalisateur (Lascars). Dans l’animation, il y a quelques dizaines d’années, on travaillait avec du papier puis des feuilles transparentes en celluloïd. C’était très analogique, très concret. »
« Puis il y a eu la colorisation par ordinateur – les métiers de traceur gouacheur ont disparu. On s’est adapté à la technologie et on s’est mis à l’ordinateur. Et ensuite, il y a eu la 3D, c’était hallucinant ! Bon maintenant, il y a l’IA, et on peut dire que les progrès sont exponentiels. Je l’attendais un peu. Je me disais que l’IA allait arriver mais il y a LA question : qui profite de tout cela ? Les producteurs et distributeurs. Pour eux, l’IA ça leur permet de faire du profit à peu de frais, ça va leur coûter moins cher. Et si le public s’adapte à cette sauce, j’en arrive à ma dernière question : où sera le côté artistique ? Car juste avec un prompt, peut-on devenir artiste ? »
« On restera des artisans plutôt que des machines »
« Il est certain que le métier de demain est spécialiste prompt, valide Vincent Vacarias, artiste VFX et directeur artistique sur la série Sambre. Mais qu’est-ce qu’on peut dégager de tout cela ? J’ai une vraie crainte : est-ce qu’on ne va pas un peu tourner en rond rapidement ? Et qu’en sera-t-il des droits d’auteurs dans ce domaine ? »
Il explique que dans son métier, « l’IA en général ouvre beaucoup de possibilités en direction artistique, pour développer ses idées. En effet visuel, c’est intéressant pour explorer les textures. Par exemple, pour imaginer une porte de château-fort, je peux obtenir plein de variantes, c’est mieux qu’une recherche image sur Google. L’IA pour compléter son imaginaire, c’est utile, mais à la fin c’est clairement un autre métier, même si les prompts deviennent précis. J’imagine que faire un film 100% IA sera possible, mais nous, on restera des artisans plutôt que des machines. »
Laurent Nicolas en arrive à la même conclusion : « l’IA va venir perturber nos métiers c’est certain. Pour l’instant, l’évolution de l’IA reste encore très parallèle avec le métier classique qui demeure plus qualitatif, mais ça va se rejoindre comme sur une bretelle d’autoroute, s’amuse-t-il. Notre savoir-faire va devenir un artisanat rare. Miyazaki travaille encore avec des feuilles celluloïd, alors on sera comme des ouvriers compagnons du devoir, comme des tailleurs de pierre. »
« C’est tellement large ce qui arrive avec l’IA que même les comédiens peuvent craindre pour leurs emplois »
Pour l’heure, Sora ne génère que des vidéos inférieures à une minute, et OpenAI assure que son modèle sera dans l’incapacité de générer certains types de contenus – violents, notamment. « C’est juste moche », tranche le streameur FibreTigre, auprès de l’AFP, à propos des vidéos présentées par la firme de Sam Altman. « Et je pense qu’il va y avoir une fatigue énorme des spectateurs, ce qui va valoriser tout ce qui n’est pas de l’IA », nuance-t-il.
Mais il s’interroge : « La vraie question, c’est combien ça va coûter de faire une vidéo avec Sora, et est-ce que ça vaudra le coup ? » FibreTigre déplore comme Laurent et Vincent un problème de direction artistique dans le produit final.
Bientôt cette techno sera utilisée par les agences de pub et prods médiocres, ce qui donnera lieu à la naissance d’une contre culture nouvelle à base de dessins au feutre sur papier canson, des histoires racontées autour d’un feu de camp, un street fighter avec des marionnettes https://t.co/F88FirkoWz
— FibreTigre (@FibreTigre) February 16, 2024
Selon Laurent Nicolas, « on n’en souffre pas encore. La crise [actuelle], ce sont les network, les plateformes, les profits… pas l’IA. Quand la 3D est arrivée, je me suis dit tant mieux si quelqu’un qui ne sait pas dessiner y arrive », sourit-il. « Un jour, peut-être, l’IA me mettra au chômage mais pas encore, ajoute Vincent Vacarias, mais c’est tellement large ce qui arrive avec l’IA que même les comédiens peuvent craindre pour leurs emplois… »
« OpenAI, c’est du développement produit, pas de la recherche en IA »
Si YouTube n’a pas officiellement réagi à l’annonce de Sora, en novembre, elle a expliqué qu’elle allait mettre en place de nouveaux garde-fous, notamment un étiquetage spécifique des contenus IA et la possibilité pour les créateurs, spectateurs et artistes de demander la suppression de contenus générés par ces outils les concernant.
Crédit: Lien source


Les commentaires sont fermés.