Elon Musks nye versjon av Grok AI forbedrer evnen til koding og matematikk
xAI
Elon Musk-eide xAI har lansert en oppdatert versjon av sin storskala språkmodell Grok-1.5 til tidlige testere. Ifølge selskapet viser den nye versjonen bedre resonneringsevner og ferdigheter, samt evne til å håndtere lengre kontekster.
Hva er kjent
Ifølge xAI utkonkurrerer Grok-1.5 konkurrerende modeller som OpenAIs GPT-4, Googles Gemini Pro 1.5 og Anthropics Claude 3 Opus i en rekke benchmarks knyttet til matematiske oppgaver og koding.
Grok-1.5s resultater i MATH-, GSM8K- (matematikk) og HumanEval- (koding) benchmarks har forbedret seg betydelig sammenlignet med den forrige versjonen og overgår konkurrentene, med unntak av Claude 3 Opus i HumanEval-testen.
Sammenligning av Grok-1.5 med andre språkmodeller i populære benchmarks
I tillegg kan den nye versjonen av Grok behandle kontekster på opptil 128 000 tokens, noe som er 16 ganger mer enn den forrige versjonen. Dette gjør det mulig for modellen å kombinere informasjon fra flere kilder for å få en bedre forståelse av situasjonen.
Til tross for de påståtte fremskrittene innen matematikk og koding har xAI ikke gitt noen detaljer om Groks forbedringer på andre områder der den fortsatt kan ligge etter konkurrentene.
Foreløpig er Grok bare tilgjengelig for premiumbrukere av plattformen X (tidligere Twitter), som eies av Elon Musk. Det forventes imidlertid at chatboten vil bli gjort tilgjengelig for vanlige X-brukere i nær fremtid.
Lanseringen av den oppdaterte versjonen av Grok skjer i påvente av den neste store oppdateringen av ChatGPT fra OpenAI, som lover mer menneskelignende interaksjon med kunstig intelligens.
Kilde: Engadget