Post Image

ChatGPT 4o : un pas de géant sur le marché de l’intelligence artificielle

Alors que Google a dévoilé ses nouveaux outils d’intelligence artificielle le mardi 14 mai, il ne peut rivaliser avec son principal concurrent : OpenAI. En effet, 24 heures plus tôt, la start-up de Sam Altman présentait une nouvelle mise à jour de ChatGPT. Et elle éclipse totalement les produits redondants de Google. 

La prouesse technique ? Un échange aussi rapide qu’avec un humain

ChatGPT-4o (le « o » pour « omnimodal ») a mis le monde entier bouche bée. En effet, son nouveau modèle de langage (LLM) se présente comme une évolution des versions précédentes. Désormais accessible dans une cinquantaine de langues différentes, cette version est capable de tenir des conversations orales fluides avec ses utilisateurs. Plus rapide, plus performant et surtout multimodal, le nouveau bot intelligent d’Open AI a appris à faire mieux que ses ainés, améliorant notamment ses capacités d’analyse en interprétation de texte, d’audio et d’image. De quoi révolutionner le marché de l’Intelligence Artificielle. 

Selon François Cazals, professeur adjoint à HEC et spécialiste des stratégies digitales, ce passage à une IA vocale et multimodale est une prouesse technique :  « La latence dans les échanges de 3 dixièmes de secondes correspond au temps d’une conversation entre humains ». Nicolas Gaudemet, directeur exécutif en charge de l’IA du cabinet Onepoint, complète : « C’est techniquement impressionnant, car ce modèle de langage travaille vraiment sur l’audio, y compris les sons non verbaux comme les émotions, alors qu’il passait avant par une transcription en texte qui perdait en information et en spontanéité ».

OpenAI veut s’imposer comme la référence de chatbot

Et le changement le plus impressionnant se trouve du côté API. Selon OpenAI, l’API de GPT est deux fois plus rapide, pour un tarif deux fois moins cher. Une promesse qui ancre une volonté claire : s’imposer comme le chatbot par excellence pour les entreprises et les utilisateurs, au détriment de Google et Meta, qui, eux aussi, misent gros sur l’IA générative et les assistants virtuels.

L’avantage principal de cette annonce réside dans l’arrivée du LLM GPT-4 pour tout le monde. Jusqu’à présent, la dernière mise à jour du modèle de langage était réservée aux abonnés ChatGPT Plus. GPT-4o est désormais gratuit pour n’importe quel internaute, y compris celles et ceux qui ne possèdent pas de compte Open AI. De quoi rendre l’abonnement payant de ChatGPT moins intéressant.

Les ingénieurs présentent la nouvelle version de ChatGPT en vidéo

Les ingénieurs d’OpenAI décide d’adopter le format vidéo pour présenter la version améliorée, et même humanisée, de ChatGPT. Il n’en aurait pas pu être autrement, étant donné toutes les possibilités à démontrer. 

  1. Des traductions instantanées pour les voyageurs

Dans cette vidéo de présentation, deux ingénieurs indiquent à ChatGPT leur volonté de traduire des propos – dans les deux sens – en anglais et en espagnol. L’agent conversationnel s’exécute parfaitement et prend même le loisir d’ajouter une intonation différente (et un petit accent) suivant la langue choisie.

Le son naturel est aussi l’un de ses atouts. L’outil peut caler des blagues de temps à autre et ajouter des onomatopées dans les réponses, pour accentuer un peu plus le naturel. La tonalité de la voix a aussi été travaillée par OpenAI. Il est désormais capable de raconter une histoire avec différents tons (dramatique, joyeux, robotique etc) et même chanter.

2. Des conversations comme avec un humain

Comme expliqué plus haut, grâce à sa fonctionnalité “Voice”, GPT-4o est capable de tenir des « conversations vocales en temps réel ». Une fonctionnalité qui – rappelons-le – n’est pas nouvelle, puisqu’elle est gratuite pour tous les utilisateurs de ChatGPT depuis novembre dernier.

Et la grande nouveauté, c’est qu’on peut l’interrompre pour rebondir sur des propos donnés. Ou bien poursuivre la discussion sur un autre sujet.

3. Un outil visionnaire, peut-être plus rapide que vous

La troisième nouveauté qui, là encore, n’en est pas vraiment une (puisqu’elle était jusqu’ici payante) : ChatGPT “Vision”. Où comment l’intelligence artificielle générative est capable de commenter un flux vidéo en temps réel.

Dans sa vidéo de présentation, l’outil dissèque d’abord un calcul mental, dont il va ensuite donner la méthode pour le résoudre. Au fur et à mesure que la méthode de calcul est exécutée par son utilisateur (ici l’un des chercheurs), “Vision” se mue en professeur de mathématiques et congratule même son vis-à-vis une fois le résultat trouvé.

4. Une arrivée sur MacOS

Autre annonce : l’arrivée de ChatGPT sur Mac. L’agent conversationnel ne perdra pas une miette de ses capacités sur MacOS. Une annonce d’une grande importance tandis Apple pourrait conclure un accord avec OpenAI pour intégrer ChatGPT à iOS 18 dans les prochains jours.

Par cette démonstration de force, la jeune pousse protégée de Microsoft prend l’initiative de s’adresser au grand public afin d’augmenter son audience. « Ils font des efforts d’optimisation de leurs produits dans une démarche claire d’accélération de l’adoption», analyse Nicolas Gaudemet. « Cela montre une certaine maturité et un besoin d’occuper le terrain en attendant des annonces d’un modèle beaucoup plus puissant. »

OpenAI a donc tiré en premier, et massivement. Nous sommes en droit de nous poser la question : est-ce la fin de l’ère du géant Google ? L’avenir proche nous le dira. 

Nathan ROTHMAN

Passionné par l’entreprenariat, j’ai accompagné de nombreux entrepreneurs dans le parcours de création d’entreprise pendant plus de 10 ans. J’ai monté de nombreuses startups à succès et souhaite me concentrer dans le développement et l’expérience utilisateur au sein des Tricolores.
Les Tricolores est une société numéro 1 de la domiciliation à Paris et dans toute la France ainsi que les formalités juridiques.