Alors que Google a dévoilé ses nouveaux outils d’intelligence artificielle le mardi 14 mai, il ne peut rivaliser avec son principal concurrent : OpenAI. En effet, 24 heures plus tôt, la start-up de Sam Altman présentait une nouvelle mise à jour de ChatGPT. Et elle éclipse totalement les produits redondants de Google.
La prouesse technique ? Un échange aussi rapide qu’avec un humain
ChatGPT-4o (le « o » pour « omnimodal ») a mis le monde entier bouche bée. En effet, son nouveau modèle de langage (LLM) se présente comme une évolution des versions précédentes. Désormais accessible dans une cinquantaine de langues différentes, cette version est capable de tenir des conversations orales fluides avec ses utilisateurs. Plus rapide, plus performant et surtout multimodal, le nouveau bot intelligent d’Open AI a appris à faire mieux que ses ainés, améliorant notamment ses capacités d’analyse en interprétation de texte, d’audio et d’image. De quoi révolutionner le marché de l’Intelligence Artificielle.
Selon François Cazals, professeur adjoint à HEC et spécialiste des stratégies digitales, ce passage à une IA vocale et multimodale est une prouesse technique : « La latence dans les échanges de 3 dixièmes de secondes correspond au temps d’une conversation entre humains ». Nicolas Gaudemet, directeur exécutif en charge de l’IA du cabinet Onepoint, complète : « C’est techniquement impressionnant, car ce modèle de langage travaille vraiment sur l’audio, y compris les sons non verbaux comme les émotions, alors qu’il passait avant par une transcription en texte qui perdait en information et en spontanéité ».
OpenAI veut s’imposer comme la référence de chatbot
Et le changement le plus impressionnant se trouve du côté API. Selon OpenAI, l’API de GPT est deux fois plus rapide, pour un tarif deux fois moins cher. Une promesse qui ancre une volonté claire : s’imposer comme le chatbot par excellence pour les entreprises et les utilisateurs, au détriment de Google et Meta, qui, eux aussi, misent gros sur l’IA générative et les assistants virtuels.
L’avantage principal de cette annonce réside dans l’arrivée du LLM GPT-4 pour tout le monde. Jusqu’à présent, la dernière mise à jour du modèle de langage était réservée aux abonnés ChatGPT Plus. GPT-4o est désormais gratuit pour n’importe quel internaute, y compris celles et ceux qui ne possèdent pas de compte Open AI. De quoi rendre l’abonnement payant de ChatGPT moins intéressant.
Les ingénieurs présentent la nouvelle version de ChatGPT en vidéo
Les ingénieurs d’OpenAI décide d’adopter le format vidéo pour présenter la version améliorée, et même humanisée, de ChatGPT. Il n’en aurait pas pu être autrement, étant donné toutes les possibilités à démontrer.
-
Des traductions instantanées pour les voyageurs
Dans cette vidéo de présentation, deux ingénieurs indiquent à ChatGPT leur volonté de traduire des propos – dans les deux sens – en anglais et en espagnol. L’agent conversationnel s’exécute parfaitement et prend même le loisir d’ajouter une intonation différente (et un petit accent) suivant la langue choisie.
Le son naturel est aussi l’un de ses atouts. L’outil peut caler des blagues de temps à autre et ajouter des onomatopées dans les réponses, pour accentuer un peu plus le naturel. La tonalité de la voix a aussi été travaillée par OpenAI. Il est désormais capable de raconter une histoire avec différents tons (dramatique, joyeux, robotique etc) et même chanter.
2. Des conversations comme avec un humain
Comme expliqué plus haut, grâce à sa fonctionnalité “Voice”, GPT-4o est capable de tenir des « conversations vocales en temps réel ». Une fonctionnalité qui – rappelons-le – n’est pas nouvelle, puisqu’elle est gratuite pour tous les utilisateurs de ChatGPT depuis novembre dernier.
Et la grande nouveauté, c’est qu’on peut l’interrompre pour rebondir sur des propos donnés. Ou bien poursuivre la discussion sur un autre sujet.
3. Un outil visionnaire, peut-être plus rapide que vous
La troisième nouveauté qui, là encore, n’en est pas vraiment une (puisqu’elle était jusqu’ici payante) : ChatGPT “Vision”. Où comment l’intelligence artificielle générative est capable de commenter un flux vidéo en temps réel.
Dans sa vidéo de présentation, l’outil dissèque d’abord un calcul mental, dont il va ensuite donner la méthode pour le résoudre. Au fur et à mesure que la méthode de calcul est exécutée par son utilisateur (ici l’un des chercheurs), “Vision” se mue en professeur de mathématiques et congratule même son vis-à-vis une fois le résultat trouvé.
4. Une arrivée sur MacOS
Autre annonce : l’arrivée de ChatGPT sur Mac. L’agent conversationnel ne perdra pas une miette de ses capacités sur MacOS. Une annonce d’une grande importance tandis Apple pourrait conclure un accord avec OpenAI pour intégrer ChatGPT à iOS 18 dans les prochains jours.
Par cette démonstration de force, la jeune pousse protégée de Microsoft prend l’initiative de s’adresser au grand public afin d’augmenter son audience. « Ils font des efforts d’optimisation de leurs produits dans une démarche claire d’accélération de l’adoption», analyse Nicolas Gaudemet. « Cela montre une certaine maturité et un besoin d’occuper le terrain en attendant des annonces d’un modèle beaucoup plus puissant. »
OpenAI a donc tiré en premier, et massivement. Nous sommes en droit de nous poser la question : est-ce la fin de l’ère du géant Google ? L’avenir proche nous le dira.