Anthropics Claude 3 AI-modell slo GPT-4 på rangeringen i Chatbot Arena

Av: Bohdan Kaminskyi | 29.03.2024, 21:22

Bilde generert ved hjelp av Microsoft Designer og DALL-E 2

Anthropics store språkmodell Claude 3 Opus har for første gang utkonkurrert OpenAIs GPT-4 på Chatbot Arena, en populær rangering som brukes av forskere til å evaluere egenskapene til AI-språkmodeller.

Dette er hva vi vet

Den uavhengige forskeren Simon Willison bemerker at dette er første gang de beste tilgjengelige modellene, som Opus for kompleksitet og Haiku for effektivitet, kommer fra en annen leverandør enn OpenAI.

Chatbot Arenas rangering av chatbots

Chatbot Arena administreres av Large Model Systems Organisation (LMSYS ORG) og er basert på subjektive evalueringer fra brukere som sammenligner resultatene fra ulike språkmodeller. Denne tilnærmingen bidrar til å overvinne vanskelighetene med å objektivt evaluere ytelsen til AI-chatbots.

Suksessen til Claude 3 viser den økende konkurransen innen AI-språkmodeller. Noen brukere har allerede erstattet ChatGPT med Claude 3 i arbeidsflyten, noe som kan påvirke OpenAIs markedsandel.

OpenAI forventes imidlertid å lansere en ny, større modell, etterfølgeren til GPT-4 Turbo, i løpet av året, muligens i løpet av sommeren. Dette vil sannsynligvis føre til ytterligere endringer i rangeringen av Chatbot Arena i løpet av de kommende månedene og årene.

Forskerne understreker viktigheten av mangfold blant de ledende leverandørene på området, ettersom det bidrar til at teknologiene for AI-språkmodeller utvikler seg og blir mer effektive.

Kilde: Ars Technica Ars Technica