La nuova versione di Grok AI di Elon Musk migliora le capacità di codifica e matematica
xAI
L'azienda xAI, di proprietà di Elon Musk, ha rilasciato ai primi tester una versione aggiornata del suo modello linguistico su larga scala Grok-1.5. Secondo l'azienda, la nuova iterazione dimostra di aver migliorato le capacità di ragionamento e le abilità, oltre alla capacità di gestire contesti più lunghi.
Cosa si sa
Secondo xAI, Grok-1.5 supera modelli concorrenti come GPT-4 di OpenAI, Gemini Pro 1.5 di Google e Claude 3 Opus di Anthropic in una serie di benchmark relativi a compiti matematici e di codifica.
In particolare, i risultati di Grok-1.5 nei benchmark MATH, GSM8K (matematica) e HumanEval (codifica) sono migliorati significativamente rispetto alla versione precedente e hanno superato la concorrenza, con l'eccezione di Claude 3 Opus nel test HumanEval.
Confronto di Grok-1.5 con altri modelli linguistici in benchmark popolari
Inoltre, la nuova versione di Grok è in grado di elaborare contesti lunghi fino a 128.000 token, ossia 16 volte di più rispetto alla versione precedente. Ciò consente al modello di combinare informazioni provenienti da fonti più ampie per una migliore comprensione della situazione.
Nonostante i progressi dichiarati nella matematica e nella codifica, xAI non ha fornito dettagli sui miglioramenti di Grok in altre aree in cui potrebbe essere ancora indietro rispetto ai concorrenti.
Attualmente Grok è disponibile solo per gli utenti premium della piattaforma X (ex Twitter) di proprietà di Elon Musk. Tuttavia, si prevede che il chatbot sarà reso disponibile agli utenti regolari di X nel prossimo futuro.
Il rilascio della versione aggiornata di Grok arriva in attesa del prossimo aggiornamento di ChatGPT di OpenAI, che promette di offrire interazioni più simili a quelle umane con l'intelligenza artificiale.
Fonte: Engadget