Il modello AI Claude 3 di Anthropic ha battuto GPT-4 nella classifica della Chatbot Arena

Di: Bohdan Kaminskyi | 29.03.2024, 21:22

Immagine generata con Microsoft Designer e DALL-E 2

Il modello linguistico di grandi dimensioni Claude 3 Opus di Anthropic ha superato per la prima volta il GPT-4 di OpenAI in Chatbot Arena, una famosa classifica in crowdsourcing utilizzata dai ricercatori per valutare le capacità dei modelli linguistici di intelligenza artificiale.

Ecco cosa sappiamo

Il ricercatore indipendente Simon Willison ha notato che è la prima volta che i migliori modelli disponibili, come Opus per la complessità e Haiku per l'efficienza, provengono da un fornitore diverso da OpenAI.


Classifica dei chatbot di Chatbot Arena

Chatbot Arena è gestita dalla Large Model Systems Organisation (LMSYS ORG) e si basa sulle valutazioni soggettive degli utenti che confrontano i risultati di diversi modelli linguistici. Questo approccio aiuta a superare le difficoltà nel valutare oggettivamente le prestazioni dei chatbot AI.

Il successo di Claude 3 dimostra la crescente concorrenza nel campo dei modelli linguistici di IA. Alcuni utenti hanno già sostituito ChatGPT con Claude 3 nei loro flussi di lavoro, il che potrebbe incidere sulla quota di mercato di OpenAI.

Tuttavia, si prevede che OpenAI rilascerà un nuovo modello importante, il successore di GPT-4 Turbo, nel corso di quest'anno, probabilmente in estate. È probabile che questo porti a ulteriori cambiamenti nelle classifiche della Chatbot Arena nei prossimi mesi e anni.

I ricercatori sottolineano l'importanza della diversità tra i principali fornitori del settore, in quanto aiuta le tecnologie dei modelli linguistici di IA a evolversi e a migliorare le proprie prestazioni.

Fonte: Ars Technica