Meta og Microsoft lanserer Llama 2, en AI-språkmodell for kommersiell bruk
Meta og Microsoft har gått sammen om å lansere Llama 2, en ny generasjon storskala språkmodell utviklet for både kommersielle formål og forskningsformål.
Hva vi vet
Llama 2 distribueres gratis. Ifølge Meta er modellen trent med 40 % mer data enn Llama 1. Den kontekstuelle lengden er doblet.
Utgivelsen inkluderer modellvekter og kildekode, og antall parametere varierer fra 7 milliarder til 70 milliarder. Meta sier at Llama 2 utkonkurrerer andre språkmodeller med åpen kildekode på mange eksterne målinger, inkludert resonnering, koding, ferdigheter og kunnskapstester.
Under utviklingen av Llama 2 ble det lagt større vekt på ansvarlighet. Utviklerne har testet modellene på nytt og laget et åpenhetsskjema som beskriver mulige problemer.
I tillegg har de inkludert en guide til ansvarlig bruk samt retningslinjer for akseptabel bruk for å forhindre misbruk som kriminell aktivitet, villedende fremstillinger og spam.
Microsoft tilbyr modellen gjennom Azure AI-katalogen for bruk i skybaserte verktøy som innholdsfiltrering. Verktøyet kan også kjøres direkte på Windows-PC-er og vil være tilgjengelig via eksterne leverandører som Amazon Web Services og Hugging Face.
Den første versjonen av modellen var åpen kildekode, men var utelukkende beregnet på akademikere og forskere. Med Llama 2 kan bedrifter tilpasse teknologien til egne formål, for eksempel for å lage chatbots eller bildegeneratorer. På denne måten kan bedrifter dra nytte av modellen, og tredjepartsutviklere kan teste den for skjevheter, unøyaktigheter og andre feil.