L’outil est tellement familier qu’on pourrait penser qu’il existe depuis des années. Et pourtant, ChatGPT3 n’a été rendu public que depuis novembre 2022. Cette première version, qui a rapidement étonné par ses capacités, a été suivie six mois plus tard par ChatGPT 4, qui multiplie par un facteur 1000 la taille du modèle, et de volume de calcul pour l’entraîner par rapport à ChatGPT3. Mais le plus impressionnant reste la vitesse de diffusion de cet outil : là où il a fallu 7 ans à internet pour atteindre 100 millions d’utilisateurs, il a suffi de deux mois à ChatGPT pour en faire autant.
Puissance de calcul pour entrainer les modèles d’IA (Deutsche Bank)
Temps pour atteindre 100 millions d’utilisateurs (Visual capitalistic)

De la science aux technologies
Pourtant, l’intelligence artificielle ne date pas d’hier, et l’architecture « Transformer » sur laquelle est basée ChatGPT remonte à 2017(1). Car ce qui explique le succès fulgurant de ChatGPT, ce n’est pas une avancée scientifique, mais une avancée technologique. En effet si la science est l’étude et la compréhension du monde qui nous entoure, la technologie se définit davantage (2) comme l’usage de phénomènes physiques pour remplir une fonction précise. Par exemple si la science découvre que certains matériaux peuvent être à la fois conducteurs et isolants, la technologie qui en découle utilise cette propriété pour réaliser un transistor (capable de commander un courant pour un autre courant), puis un microprocesseur (capable de réaliser des opérations logiques).
C’est la technologie, non la science, qui crée la croissance. Les phases de forte croissance arrivent des années après les découvertes scientifiques qui leur ont donné naissance pour une raison simple : elles surviennent quand les technologies deviennent suffisamment matures (simples à utiliser, prix abordable, effets indésirables et risques bien connus) pour être assimilables par le plus grand nombre.
Simplicité, clé de l’appropriation
Ainsi, les fondements scientifiques d’Internet datent des années 1970, mais l’effet sur la croissance n’a été visible qu’à la fin des années 1990. Ce qui a stimulé cette croissance, c’est la technologie HTML, qui a permis de rendre plus simple et plus rapide la réalisation de sites Internet. Il s’est aussi passé plusieurs dizaines d’années entre les premiers prototypes de machines à vapeur (celle de Papin date de 1679) et le moment où leur utilisation s’est largement répandue, entraînant à la fois des gains de productivité considérables et – déjà – des inquiétudes pour l’emploi. Il n’y avait que 14 000 chevaux-vapeur en France en 1833 ; on en comptabilisait 500 000 en 1880. Le train à vapeur a été inventé en 1804 au Royaume-Uni ; il faudra attendre vingt ans pour voir la première ligne reliant Saint-Etienne à Andrézieux en France.
On assiste au même phénomène avec l’IA générative : tant qu’il s’agissait d’une technologie nécessitant d’installer des modèles spécifiques, elle ne concernait que peu de monde. Dès que ChatGPT ou MidJourney ont mis ce besoin de côté et proposé des systèmes que n’importe qui peut interroger dans sa langue maternelle, l’utilisation de ces outils s’est développée de façon exponentielle. Et ce d’autant plus vite que des technologies absentes à l’époque des machines à vapeur ont accéléré le phénomène – par exemple les réseaux sociaux pour permettre aux utilisateurs d’être rapidement informés de l’existence d’un outil, ou le cloud qui permettre à OpenAI d’augmenter sa capacité à l’évolution de la demande.
(1) : « Attention Is All You Need (arxiv.org)», Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin
(2) : « The Nature of Technology: What It Is and How It Evolves », Brian Arthur
Crédit: Lien source


Les commentaires sont fermés.