Meta en Microsoft geven Llama 2 vrij, een AI-taalmodel voor commercieel gebruik
Meta en Microsoft hebben hun krachten gebundeld om Llama 2 te introduceren, een nieuwe generatie grootschalig taalmodel ontworpen voor zowel commerciële als onderzoeksdoeleinden.
Wat we weten
Llama 2 wordt gratis verspreid. Volgens Meta is het model getraind met 40% meer data dan Llama 1. De contextlengte is verdubbeld. De contextuele lengte is verdubbeld.
De uitgave bevat modelgewichten en broncode, en het aantal parameters varieert van 7 miljard tot 70 miljard. Meta zegt dat Llama 2 beter presteert dan andere open-source taalmodellen op veel externe statistieken, waaronder redeneren, coderen, vaardigheid en kennistests.
Tijdens de ontwikkeling van Llama 2 is er meer aandacht besteed aan verantwoordelijkheid. De ontwikkelaars hebben de modellen opnieuw getest en een transparantieschema opgesteld met details over mogelijke problemen.
Daarnaast hebben ze een gids voor verantwoord gebruik opgenomen, evenals een beleid voor aanvaardbaar gebruik om misbruik zoals criminele activiteiten, misleidende voorstellingen en spam te voorkomen.
Microsoft levert het model via de Azure AI-catalogus voor gebruik in cloudgebaseerde tools zoals contentfiltering. De tool kan ook direct op Windows PC's draaien en zal beschikbaar zijn via externe providers zoals Amazon Web Services en Hugging Face.
De eerste versie van het model was open source, maar was uitsluitend bedoeld voor academici en onderzoekers. Met Llama 2 kunnen bedrijven de technologie aanpassen voor hun eigen doeleinden, bijvoorbeeld om chatbots of beeldgeneratoren te maken. Hierdoor kunnen bedrijven profiteren van het model en kunnen externe ontwikkelaars het testen op vertekening, onnauwkeurigheid en andere gebreken.