Le modèle d'IA Claude 3 d'Anthropic a battu GPT-4 dans le classement Chatbot Arena.

Par: Bohdan Kaminskyi | 29.03.2024, 21:22

Image générée à l'aide de Microsoft Designer et de DALL-E 2

Le grand modèle de langage Claude 3 Opus d'Anthropic a surpassé le GPT-4 d'OpenAI pour la première fois sur Chatbot Arena, un classement populaire réalisé par la foule et utilisé par les chercheurs pour évaluer les capacités des modèles de langage de l'IA.

Voici ce que nous savons

Simon Willison, chercheur indépendant, a noté que c'est la première fois que les meilleurs modèles disponibles, tels que Opus pour la complexité et Haiku pour l'efficacité, proviennent d'un fournisseur autre qu'OpenAI.


Classement des chatbots de Chatbot Arena

Chatbot Arena est géré par la Large Model Systems Organisation (LMSYS ORG) et repose sur des évaluations subjectives d'utilisateurs comparant les résultats de différents modèles de langage. Cette approche permet de surmonter les difficultés liées à l'évaluation objective des performances des chatbots d'IA.

Le succès de Claude 3 témoigne de la concurrence croissante dans le domaine des modèles de langage d'IA. Certains utilisateurs ont déjà remplacé ChatGPT par Claude 3 dans leur flux de travail, ce qui pourrait affecter la part de marché d'OpenAI.

Cependant, OpenAI devrait publier un nouveau modèle majeur, le successeur de GPT-4 Turbo, au cours de cette année, probablement pendant l'été. Cela devrait entraîner d'autres changements dans les classements de Chatbot Arena dans les mois et les années à venir.

Les chercheurs soulignent l'importance de la diversité parmi les principaux fournisseurs dans ce domaine, car elle permet aux technologies de modèles de langage d'IA d'évoluer et d'améliorer leurs performances.

Source : Ars Technica : Ars Technica