Microsoft et OpenAI s’apprêtent à lever le voile sur GPT-4, une importante mise à jour qui devrait révolutionner le fonctionnement de ChatGPT. On fait le point sur les informations disponibles pour le moment.
ChatGPT, l’incontournable chatbot d’OpenAI, est basé sur un modèle linguistique baptisé GPT (Generative Pretrained Transformer). Ce modèle utilise l’apprentissage profond pour générer du texte en réponse à la requête d’un interlocuteur. Actuellement, le robot conversationnel exploite GPT-3.5, une version intermédiaire du modèle de langage. Cette itération a été annoncée en mars 2022, quelques mois avant la déferlante ChatGPT.
Évidemment, la prochaine mise à jour majeure de l’IA, GPT-4, est attendue avec impatience par les utilisateurs et les experts, déjà bluffés par les performances de ChatGPT. Selon des rumeurs, cette évolution serait énormément plus puissante que la version actuelle. Prudent et mesuré, Sam Altman, PDG et fondateur d’OpenAI, a jusqu’ici tenté de tempérer les attentes des internautes. Selon lui, GPT-4 ne sera qu’une évolution timide de GPT-3.
En janvier dernier, il a même assuré qu’OpenAi n’était pas pressé de déployer GPT-4. Altman préfère que sa société prenne tout le temps dont elle a besoin pour faire les choses correctement. Il précisait qu’OpenAI allait lancer ses « technologies bien plus lentement que ce que les gens voudraient ».
À lire aussi : Microsoft Bing est plus populaire que jamais depuis l’intégration de ChatGPT
Présentation le 16 mars 2023
Pourtant, il s’avère finalement que la présentation de GPT-4 serait prévue dans les jours à venir. Interrogé par le média Heise Online lors de l’événement KI im Fokus, Andreas Braun, le directeur technique de Microsoft Allemagne, a en effet déclaré, à la surprise générale :
« Nous présenterons GPT-4 la semaine prochaine ».
Le cadre n’en dit pas plus, mais cette révélation laisse penser que Microsoft et OpenAI ont prévu de dévoiler la nouvelle version du modèle linguistique dès le jeudi 16 mars 2023. Ce jour-là, Microsoft organise en effet une conférence en ligne focalisée sur l’intelligence artificielle, intitulée « le futur du travail avec l’IA ». La présentation est consacrée à l’utilisation de l’IA dans le monde professionnel. Elle débutera à 17 h, heure de Paris.
Pour le moment, il s’agit de la seule communication officielle au sujet d’une annonce de GPT-4. Il n’est pas impossible que le cadre allemand ait dévoilé des informations sans l’aval de la hiérarchie.
Quelles nouveautés pour GPT-4 ?
Le responsable Microsoft ajoute que GPT-4 embarquera « des modèles multimodaux qui offriront des possibilités complètement différentes ». Un modèle multimodal est en mesure de combiner et de traiter plusieurs sources de données, comme du texte, de l’audio ou des images, pour affiner ses résultats.
Parmi les possibilités offertes par GPT-4, Andreas Braun cite les vidéos. Concrètement, l’intelligence artificielle serait capable de générer des vidéos, de la même manière que Make-A-Video, l’IA mise au point par Meta. Il suffirait d’entrer quelques mots pour que les algorithmes génèrent une séquence. Cette évolution de GPT sous-tendrait la future intelligence artificielle d’OpenAI conçue pour la production de vidéos. Sam Altman l’a déjà évoqué à demi-mots lors d’une conférence en janvier.
Désormais multimodale, la quatrième version de GPT serait théoriquement capable de comprendre une requête vocale et d’en tirer un résultat sous la forme de texte ou d’images. De même, l’IA pourrait générer un texte, une vidéo ou des montages en « regardant » une photo. Avec la multimodalité, Microsoft ambitionne de « rendre les modèles plus complets », résume Andreas Braun.
L’annonce survient quelques jours après que des chercheurs de Microsoft ont dévoilé Kosmos-1, un modèle multimodal assez complet pour résoudre des énigmes visuelles et analyser le contenu d’une image. D’après les créateurs de Kosmos-1, l’approche multimodale est l’une des grandes étapes vers la création d’une intelligence artificielle générale, qui peut fonctionner à la manière du cerveau humain. C’est le grand objectif d’OpenAI à long terme.
Notez que rien n’indique que la présentation s’accompagnera d’une mise à jour de ChatGPT et du déploiement de GPT-4, que ce soit par le biais d’une interface publique ou d’une API. Microsoft et OpenAI peuvent très bien se contenter de présenter les grands changements du modèle linguistique, même si celui-ci n’est pas encore tout à fait au point.
Source :
Heise Online