Meta e Microsoft rilasciano Llama 2, un modello di linguaggio AI per uso commerciale
Meta e Microsoft hanno unito le forze per presentare Llama 2, un modello linguistico su larga scala di nuova generazione progettato per scopi commerciali e di ricerca.
Cosa sappiamo
Llama 2 è distribuito gratuitamente. Secondo Meta, il modello è stato addestrato con il 40% di dati in più rispetto a Llama 1. La lunghezza contestuale è stata raddoppiata. La lunghezza contestuale è stata raddoppiata.
Il rilascio include i pesi del modello e il codice sorgente, e il numero di parametri varia da 7 miliardi a 70 miliardi. Meta ha dichiarato che Llama 2 supera altri modelli linguistici open-source su molte metriche esterne, tra cui i test di ragionamento, codifica, competenza e conoscenza.
Durante lo sviluppo di Llama 2 è stata prestata maggiore attenzione alla responsabilità. Gli sviluppatori hanno testato nuovamente i modelli e hanno creato uno schema di trasparenza che illustra in dettaglio i possibili problemi.
Inoltre, hanno incluso una guida all'uso responsabile e una politica di utilizzo accettabile per prevenire abusi come attività criminali, rappresentazioni fuorvianti e spam.
Microsoft fornisce il modello attraverso il catalogo Azure AI per l'utilizzo in strumenti basati sul cloud come il filtraggio dei contenuti. Lo strumento può anche essere eseguito direttamente su PC Windows e sarà disponibile attraverso fornitori esterni come Amazon Web Services e Hugging Face.
La prima versione del modello era open source, ma era destinata esclusivamente ad accademici e ricercatori. Llama 2 consente alle aziende di personalizzare la tecnologia per i propri scopi, ad esempio per creare chatbot o generatori di immagini. In questo modo le aziende possono trarre vantaggio dal modello e gli sviluppatori di terze parti possono testarlo per verificare l'assenza di pregiudizi, imprecisioni e altri difetti.