Apparu mystérieusement sur un site de comparaison des grands modèles de langage, le modèle gpt2-chatbot intrigue la communauté de l’intelligence artificielle (IA). Supposément capable de résoudre des problèmes inabordables pour GPT-4, il pourrait être un prototype d’un futur modèle OpenAI. Sam Altman, le patron de l’entreprise, ne cache pas son amusement.
OpenAI s’apprête-t-il à faire une annonce majeure ? Historiquement, la marque a toujours aimé dévoiler de nouvelles choses simultanément à ses concurrents, pour leur voler la vedette. La Google I/O le 14 mai et l’Apple WWDC le 10 juin sont des cibles parfaites pour le groupe de Sam Altman : il pourrait se laisser tenter par la sortie d’un nouveau modèle de langage pour contrecarrer les annonces en IA de ses concurrents. Reste à savoir si GPT-5, GPT-4.5, Sora, Q-Star ou quoi que ce soit d’autre sera prêt dans les temps.
En attendant, un mystérieux modèle de langage fait beaucoup parler de lui depuis le 29 avril. Apparu sur le comparateur de chatbots LMSYS, gpt2-chatbot est présenté par certains observateurs comme le potentiel successeur de GPT-4, ou du moins d’une version dérivée. Sam Altman, le patron d’OpenAI, s’est même amusé à tweeter qu’il avait « un faible pour gpt2 », en insistant bien sur l’absence de tiret. Il a modifié explicitement son tweet pour ôter toute ressemblance avec GPT-2, le prédécesseur de GPT-4, sorti en 2019. Que cache ce fameux gpt2-chatbot ?
![Dans un tweet, Sam Altman entretient la rumeur gpt2. Il a volontairement supprimé le tiret pour aiguiser les soupçons. Dans un tweet, Sam Altman entretient la rumeur gpt2. Il a volontairement supprimé le tiret pour aiguiser les soupçons.](https://c0.lestechnophiles.com/www.numerama.com/wp-content/uploads/2024/04/capture-decran-2024-04-30-a-101915-1024x474.png?resize=1024,474&key=2cdec0cc)
gpt2 ou GPT-2 : un tiret qui a toute son importance
Pourquoi retirer le tiret ? L’acronyme GPT signifie « Generative Pre-training Transformer », ce qui correspond au mécanisme qui permet de lire du texte et d’en fabriquer, après s’être entraîné avec des milliards de documents. GPT-4, avec un tiret, est la quatrième itération de la « machine » GPT. Compte tenu de l’absence de tiret entre l’acronyme et le chiffre pour gpt2-chatbot, on peut supposer qu’il ne s’agit pas du modèle GPT-2 sorti en 2019, et dorénavant daté.
Avec son tweet modifié, Sam Altman met de facto l’accent sur un nom gpt2 dont la graphie est signifiante. Certains supposent une seconde version du mécanisme de transformation d’OpenAI, reconstruit ou bien remodelé pour l’occasion, même si rien ne permet de l’affirmer. D’autres avancent que cet acronyme gpt2-chatbot serait l’équivalent d’un éventuel GPT2-1, ce qui signifierait que le GPT-5 en tant que suite logique de GPT-4 n’existerait pas.
![Sur Twitter et Reddit, de nombreux comptes spéculent sur gpt2-chatbot. Le tweet de Sam Altman n'a fait que renforcer les doutes. Sur Twitter et Reddit, de nombreux comptes spéculent sur gpt2-chatbot. Le tweet de Sam Altman n'a fait que renforcer les doutes.](https://c0.lestechnophiles.com/www.numerama.com/wp-content/uploads/2024/04/capture-decran-2024-04-30-a-104812-948x1024.jpg?resize=948,1024&key=b43478a2)
gpt2-chatbot est-il une révolution… ou un scam ?
Qui a fabriqué gpt2-chatbot ? Pour le savoir, quoi de mieux que de lui poser la question.
L’agent conversationnel est entraîné pour dire qu’il est ChatGPT et qu’il se fonde sur GPT-4, ce qui veut en même temps tout et rien dire. Son créateur, volontairement ou involontairement, a pu lui donner pour consigne de répondre qu’il a été créé par OpenAI quand on lui demande. À l’inverse, OpenAI peut forcer un modèle de langage expérimental à se faire passer pour GPT-4 pour cacher son vrai nom. Seule certitude : le modèle gpt2-chatbot partage les mêmes faiblesses que les autres modèles d’OpenAI, ce qui suggère que l’entreprise américaine se cache bien derrière sa création.
![Pour certains spécialistes, gpt2-chatbot est plus intelligent que GPT-4. Pour certains spécialistes, gpt2-chatbot est plus intelligent que GPT-4.](https://c0.lestechnophiles.com/www.numerama.com/wp-content/uploads/2024/04/capture-decran-2024-04-30-a-105557-1024x468.png?resize=1024,468&key=faa5ed07)
Quand on parcourt Twitter, on peut lire divers avis sur gpt2-chatbot. Il est présenté comme un chatbot incroyablement doué en programmeation et en mathématiques. Il est aussi décrit comme une version allégée de GPT-4… Plusieurs théories fusent et vont d’un futur modèle GPT-5 révolutionnaire à une version open source de GPT-4, en passant par une version plus évoluée du mécanisme derrière ChatGPT.
En l’état, difficile de se prononcer sur ce qu’est précisément gpt2-chatbot ; il a, en l’état, autant de chances d’être la prochaine grande itération d’OpenAI qu’une imitation open source. Ce mystérieux chatbot est actuellement limité à 8 interactions par usager, avec un quota fixé à 1 000 par heure à échelle de son serveur. C’est faible.
![Capture d’écran 2024-04-30 à 11.04.48 Capture d’écran 2024-04-30 à 11.04.48](https://c0.lestechnophiles.com/www.numerama.com/wp-content/uploads/2024/04/capture-decran-2024-04-30-a-110448.png?resize=1514,884&key=7be67a1a)
Si Sam Altman n’avait pas écrit son tweet énigmatique, gpt2-chatbot pourrait être perçu comme trop flou pour être pris au sérieux. La publication du patron d’OpenAI incite toutefois à s’y attarder. Elle laisse en tout cas supposer qu’une annonce est imminente. Reste à savoir s’il s’agit bien d’une deuxième version de la machine qu’est GPT, d’un nouveau modèle de type GPT-4.5/GPT-5, d’un projet inédit, ou d’un mirage.
Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !
KABDEL MEDIA