Elon Musks nieuwe versie van Grok AI verbetert coderings- en wiskundecapaciteiten

Via: Bohdan Kaminskyi | 02.04.2024, 10:31

xAI

xAI, eigendom van Elon Musk, heeft een bijgewerkte versie van zijn grootschalige taalmodel Grok-1.5 vrijgegeven aan vroege testers. Volgens het bedrijf laat de nieuwe iteratie verbeterde redeneercapaciteiten en vaardigheden zien, evenals de mogelijkheid om langere contexten aan te kunnen.

Wat is bekend

Volgens xAI presteert Grok-1.5 beter dan concurrerende modellen zoals OpenAI's GPT-4, Google's Gemini Pro 1.5 en Anthropic's Claude 3 Opus in een aantal benchmarks met betrekking tot wiskundige taken en codering.

Met name de resultaten van Grok-1.5 in de MATH, GSM8K (wiskunde) en HumanEval (codering) benchmarks zijn aanzienlijk verbeterd ten opzichte van de vorige versie en presteren beter dan de concurrentie, met uitzondering van Claude 3 Opus in de HumanEval test.

Vergelijking van Grok-1.5 met andere taalmodellen in populaire benchmarks

Daarnaast kan de nieuwe versie van Grok contexten tot 128.000 tokens verwerken, wat 16 keer meer is dan de vorige versie. Hierdoor kan het model informatie uit grotere bronnen combineren voor een beter begrip van de situatie.

Ondanks de geclaimde vooruitgang op het gebied van wiskunde en codering, gaf xAI geen details over de verbeteringen van Grok op andere gebieden waar het mogelijk nog achterloopt op concurrenten.

Op dit moment is Grok alleen beschikbaar voor premium gebruikers van het X (voorheen Twitter) platform van Elon Musk. Er wordt echter verwacht dat de chatbot in de nabije toekomst ook beschikbaar zal zijn voor gewone X-gebruikers.

De release van de bijgewerkte versie van Grok komt in afwachting van de volgende grote update van ChatGPT van OpenAI, die meer mensachtige interacties met kunstmatige intelligentie belooft te bieden.

Bron: Engadget