GPT-4 Disponible : quand IA et génération de texte atteignent de nouveaux sommets

Le monde de l’intelligence artificielle ne cesse de nous surprendre avec des avancées toujours plus impressionnantes. La dernière en date concerne le lancement de GPT-4 par OpenAI, une version améliorée de son prédécesseur, le GPT-3 et 3.5. Les différences entre ces modèles sont nombreuses et même carrément révolutionnaires, comme la reconnaissance d’image dans les prompts de GPT-4.

À noter :
GPT-4 n’est actuellement disponible que pour les abonnés « Plus » avec une limitation d’usage par heure.

Ce matin, j’allume mon PC et je me branche sur tous les sites que j’ai l’habitude d’utiliser de façon quotidienne et en ouvrant ChatPGT je vois passer un truc… ÉnOooOOrme

Je rate la première capture d’écran qui ne veut pas revenir mais les suivantes les voilà :

Comme je suis hypersérieux question planning, je laisse tomber instantanément tout ce que je devais faire pour la journée et je me précipite sur le modèle GPT-4 que me propose ChatGPT Plus…

Les avancées majeures de GPT-4

GPT-4 est, comme son nom l’indique, le successeur du GPT-3, et 3.5, des modèles de langage révolutionnaires qui ont déjà démontré des performances impressionnantes. La version 4 apporte plusieurs améliorations significatives, notamment en termes de capacités de traitement, de génération de texte et de compréhension du contexte. Les principales différences entre GPT-4 et GPT-3 sont :

  • Une augmentation substantielle de la taille du modèle
  • Des performances améliorées en termes de génération de texte
  • Une meilleure compréhension du contexte et de la nuance
  • La gestion des images

Taille du modèle

La première différence notable entre GPT-3 et GPT-4 est la taille du modèle. GPT-4 possède un nombre bien plus important de paramètres, ce qui lui confère une capacité accrue pour apprendre et comprendre des modèles complexes dans les données. Cette amélioration permet à GPT-4 d’offrir des performances de génération de texte encore plus impressionnantes que celles de son prédécesseur.

GPT-4 aura été entraîné sur 100 billions de paramètres, contre 175 milliards pour GPT-3 et 3.5 (source). Si ces chiffres sont vrais (et ils n’ont pas été confirmés par OpenAI, donc prudence) c’est quand même 570 plus…

Petit rappel : (1 billion en français c’est 1000 milliards, et se traduit par « Trillion » en anglais)

Performances en matière de génération de texte

Grâce à sa taille accrue et à l’amélioration de ses algorithmes, GPT-4 est capable de générer des textes de meilleure qualité que GPT-3 et GPT-3.5. Les réponses fournies par GPT-4 sont plus cohérentes et pertinentes, ce qui se traduit par une expérience utilisateur grandement améliorée. Cette avancée est particulièrement intéressante pour les applications de chatbot, d’assistance virtuelle et de rédaction automatisée.

Attention cependant ; la génération est plus lente qu’avec le modèle par défaut proposé par ChatGPT.

Il dit moins de bêtises.

Nous n’avons pas encore eu le temps de le soumettre à « La Question » comme on disait au Moyen Âge sur des sujets qui lui posaient problème auparavant, mais d’après OpenAI, GPT-4 dit moins de « contre-vérités » comme disent nos politiques.

Le texte exact une fois traduit de l’annonce de OpenAI est :

(GTP-4) est 40% plus susceptibles de produire des réponses factuelles que le GPT-3.5 dans nos évaluations internes.

OpenAI

Contexte et nuance sous stéroïdes

Une autre amélioration majeure de GPT-4 est sa capacité à comprendre le contexte et la nuance des textes. Contrairement à GPT-3, le nouveau modèle est plus apte à saisir les subtilités du langage et à répondre de manière appropriée en fonction du contexte. Cela rend GPT-4 plus adapté à une variété d’applications, y compris celles qui nécessitent une compréhension approfondie du langage et de la communication.

Au niveau du contexte d’une conversation, GPT-3 perd rapidement le contexte général et la cohérence s’en ressentait. Avec les longueurs de jetons ‘Tokens’ plus importantes, GPT-3.5 la conservait déjà bien mieux avec une fenêtre contextuelle de 4 000 tokens ! Pour un peu plus de clarté, on considère que 100 tokens représentent environ 75 mots. GPT-3.5 avait donc un contexte de 3000 mots (requête plus réponse)

Avec GPT-4 on passe à 25 000 mots…

Oui, vous avez bien lu. On passe à un format contextuel de 25 000 mots. Soit plus de 33 000 tokens.

Vous allez pouvoir lui raconter votre vie et lui, la sienne (ah ben non il n’est pas vivant, comme il vous le fera souvent remarquer)

Il va accepter des données visuelles.

Cliquez pour agrandir

Alors celle-là, je ne m’y attendais pas…

GPT-4 va accepter les données visuelles. Si, si… Comme je te le dis…

L’IA pourra analyser des photographies, générer des légendes et fournir des descriptions en réponse à des images saisies par vos soins.

Cette fonctionnalité fait actuellement l’objet de tests bêta et n’a pas encore été mise à la disposition du grand public, mais visiblement, cela ne saurait tarder.

Petite preuve en image d’une application possible présentée par OpenAI

Il peut lire des pages web

Les possibilités qu’offre cette fonctionnalité sont vraiment énormes.

Dans l’exemple donné sur le site web de l’OpenAI, l’invite donnée à GPT-4 comprenait un lien vers une page web et une information spécifique était demandée à partir de cette page.

Le modèle GPT-4 a pu fournir correctement une réponse basée sur les informations de la page web. En clair : vous lui dites :

Fais-moi un résumé de l'article situé à l’adresse suivante : https://adresseDuSite.com
Cliquez pour agrandir

Et il vous rédige un petit rapport pour vous donner les grandes lignes. Si vous êtes créatifs, les possibilités qu’offre cette fonctionnalité alliée à la puissance de GPT-4 vont vous permettre de faire et de développer des choses qui étaient encore impossibles il y a un an au commun des mortels…

Je vous laisse infuser le truc dans votre tête…

Petit exemple tiré de OpenAI eux même en image (cliquez pour avoir l(image en grand)

Les nouveautés pour les abonnés ChatGPT Plus

Le lancement de GPT-4 apporte également des avantages spécifiques pour les abonnés de ChatGPT Plus.

Les utilisateurs de ce service pourront bénéficier des fonctionnalités avancées du nouveau modèle, notamment une meilleure qualité de génération de texte et une compréhension plus fine du contexte et de la nuance.

Cela est censé se traduire par une expérience utilisateur plus fluide et efficace pour les abonnés de ChatGPT Plus.

Les développeurs qui utilisent ChatGPT Plus n’ont pas été oubliés et pourront tirer parti des capacités améliorées de GPT-4 pour créer des applications et des services plus performants et sophistiqués. C’est vague… On attend des infos un peu plus concrètes.

Les chatbots, assistants virtuels et les outils de rédaction automatisée basés sur GPT-4 pourront offrir des expériences utilisateur plus personnalisées et contextuellement pertinentes, grâce à la compréhension approfondie du langage et de la communication dont dispose le nouveau modèle.

En clair, les logiciels de type JasperAI risquent de se jeter dessus si l’API est dispo afin d’augmenter la qualité de leur offre (et leurs tarifs)…

Il est également important de noter que l’arrivée de GPT-4 coïncide avec une augmentation du nombre d’utilisateurs autorisés à accéder à ChatGPT Plus. Cela signifie que davantage de personnes pourront bénéficier des avantages offerts par ce service et explorer le potentiel de GPT-4 pour transformer la manière dont nous interagissons avec les technologies basées sur le langage.

Pour rappel, selon une étude d’UBS, ChatGPT a atteint 100 millions d’utilisateurs actifs mensuels, ce qui en fait l’application Internet grand public à la croissance la plus rapide de l’histoire. Les analystes d’UBS estiment son marché total à 1 000 milliards de dollars.(source)

En conclusion, le lancement de GPT-4 représente une étape importante dans l’évolution des modèles de langage et des technologies d’intelligence artificielle. Et les mots sont ici très (trop)mesurés.

Les améliorations apportées par GPT-4 en de taille du modèle, de cohérence, de génération de texte, de compréhension du contexte et de la nuance permettront de créer des textes, applications et services encore plus performants et sophistiqués et à la portée de toute une population qui n’est pas obligatoirement un spécialiste de l’informatique et du code.

L’expérience utilisateur (UX) risque elle aussi d’être grandement améliorée. Mais pour l’instant, seuls les abonnés de ChatGPT Plus pourront tirer parti de ces avancées pour profiter d’une expérience utilisateur encore plus fluide et efficace.

On a rien sans rien ma bonne dame…