La nuova versione di Grok AI di Elon Musk migliora le capacità di codifica e matematica

Di: Bohdan Kaminskyi | 02.04.2024, 09:38
La nuova versione di Grok AI di Elon Musk migliora le capacità di codifica e matematica
xAI

L'azienda xAI, di proprietà di Elon Musk, ha rilasciato ai primi tester una versione aggiornata del suo modello linguistico su larga scala Grok-1.5. Secondo l'azienda, la nuova iterazione dimostra di aver migliorato le capacità di ragionamento e le abilità, oltre alla capacità di gestire contesti più lunghi.

Cosa si sa

Secondo xAI, Grok-1.5 supera modelli concorrenti come GPT-4 di OpenAI, Gemini Pro 1.5 di Google e Claude 3 Opus di Anthropic in una serie di benchmark relativi a compiti matematici e di codifica.

In particolare, i risultati di Grok-1.5 nei benchmark MATH, GSM8K (matematica) e HumanEval (codifica) sono migliorati significativamente rispetto alla versione precedente e hanno superato la concorrenza, con l'eccezione di Claude 3 Opus nel test HumanEval.

La nuova versione di Grok AI di Elon Musk migliora le capacità di codifica e matematica-2
Confronto di Grok-1.5 con altri modelli linguistici in benchmark popolari

Inoltre, la nuova versione di Grok è in grado di elaborare contesti lunghi fino a 128.000 token, ossia 16 volte di più rispetto alla versione precedente. Ciò consente al modello di combinare informazioni provenienti da fonti più ampie per una migliore comprensione della situazione.

Nonostante i progressi dichiarati nella matematica e nella codifica, xAI non ha fornito dettagli sui miglioramenti di Grok in altre aree in cui potrebbe essere ancora indietro rispetto ai concorrenti.

Attualmente Grok è disponibile solo per gli utenti premium della piattaforma X (ex Twitter) di proprietà di Elon Musk. Tuttavia, si prevede che il chatbot sarà reso disponibile agli utenti regolari di X nel prossimo futuro.

Il rilascio della versione aggiornata di Grok arriva in attesa del prossimo aggiornamento di ChatGPT di OpenAI, che promette di offrire interazioni più simili a quelle umane con l'intelligenza artificiale.

Fonte: Engadget