Anthropics KI-Modell Claude 3 schlägt GPT-4 in der Rangliste der Chatbot-Arena

Von: Bohdan Kaminskyi | 29.03.2024, 21:22

Mit Microsoft Designer und DALL-E 2 generiertes Bild

Das große Sprachmodell Claude 3 Opus von Anthropic hat zum ersten Mal das GPT-4 von OpenAI in der Chatbot-Arena übertroffen, einem beliebten Crowdsourced-Ranking, das von Forschern zur Bewertung der Fähigkeiten von KI-Sprachmodellen verwendet wird.

Was bekannt ist

Der unabhängige Forscher Simon Willison stellte fest, dass dies das erste Mal ist, dass die besten verfügbaren Modelle, wie Opus für Komplexität und Haiku für Effizienz, von einem anderen Anbieter als OpenAI stammen.

Chatbot Arena Chatbot-Rangliste

Die Chatbot Arena wird von der Large Model Systems Organisation (LMSYS ORG) verwaltet und basiert auf subjektiven Bewertungen von Benutzern, die die Ergebnisse verschiedener Sprachmodelle vergleichen. Dieser Ansatz hilft dabei, die Schwierigkeiten bei der objektiven Bewertung der Leistung von KI-Chatbots zu überwinden.

Der Erfolg von Claude 3 zeigt den wachsenden Wettbewerb im Bereich der KI-Sprachmodelle. Einige Nutzer haben bereits ChatGPT durch Claude 3 in ihren Arbeitsabläufen ersetzt, was sich auf den Marktanteil von OpenAI auswirken könnte.

Es wird jedoch erwartet, dass OpenAI im Laufe dieses Jahres, möglicherweise im Sommer, ein wichtiges neues Modell, den Nachfolger von GPT-4 Turbo, herausbringt. Dies dürfte in den kommenden Monaten und Jahren zu weiteren Veränderungen in den Chatbot-Arena-Rankings führen.

Die Forscher betonen, wie wichtig die Vielfalt unter den führenden Anbietern in diesem Bereich ist, da sie dazu beiträgt, dass sich die KI-Sprachmodelltechnologien weiterentwickeln und ihre Leistung verbessern.

Quelle: Ars Technica