Le dernier modèle IA d’OpenAI est déjà dépassé !
Il s’est fait battre par un concurrent dans plusieurs domaines.
Anthropic est une compagnie qui a été créée par des anciens d’OpenAI, avec pour ambition de la concurrencer sur son principal produit, ChatGPT. Si en termes de popularité et de chiffre d’affaires, Anthropic est loin d’y arriver, en matière de performances en revanche, c’est une autre histoire.
La startup a en effet été la première à proposer un modèle (Claude 3 Opus) qui surpasse GPT-4 dans de multiples domaines, alors qu’il était considéré comme le LLM offrant les meilleurs résultats. OpenAI ne s’est pas laissée faire cependant, et a surenchéri avec son nouveau modèle GPT-4o, qui a une nouvelle fois dépassé Claude 3 Opus dans des tests de performances.
Ces derniers tests sont toutefois remis en question par de nombreux internautes, qui pensent qu’ils sont erronés. À en croire les résultats, GPT4-o ferait mieux que son grand frère GPT-4, mais dans les faits, GPT-4 semble plus compétent. D’autant plus qu’OpenAI spécifie bien que GPT-4 est son modèle le plus précis, et que GPT-4o privilégie plutôt la rapidité.
Quoi qu’il en soit, Anthropic vient d’annoncer une mise à jour de son modèle Claude 3 Sonnet. Il passe aujourd’hui en version 3.5, et concurrence directement GPT-4o de Sam Altman.
Même stratégie qu’OpenAI ?
Anthropic ne s’en cache pas, l’objectif de ce nouveau modèle est de dépasser la concurrence :
Claude 3,5 Sonnet élève la barre de l’industrie en matière d’intelligence artificielle, surpassant les modèles concurrents et Claude 3 Opus sur un large éventail d’évaluations, avec la rapidité et le coût de notre modèle de milieu de gamme, Claude 3 Sonnet.
Pour avancer ses propos, la société partage les résultats de plusieurs tests de performance :
La vision, mais pas la voix
Les points cruciaux abordés lors de la présentation de GPT-4o sont les interactions vocales et visuelles, ainsi que la rapidité à laquelle il peut nous donner une réponse. Si Anthropic ne vient pas concurrencer OpenAI sur les interactions vocales humanisées, qui font d’ailleurs polémique, elle le fait sur la vision et la rapidité. Le modèle serait deux fois plus rapide que Claude 3 Opus, et propose de meilleures performances sur plusieurs points, notamment en analyse de documents visuels.