Meta et Microsoft lancent Llama 2, un modèle linguistique d'IA à usage commercial
Meta et Microsoft ont uni leurs forces pour présenter Llama 2, un modèle linguistique à grande échelle de nouvelle génération conçu à des fins commerciales et de recherche.
Ce que nous savons
Llama 2 est distribué gratuitement. Selon Meta, le modèle a été entraîné avec 40 % de données en plus que Llama 1. La longueur contextuelle a été doublée.
La version comprend les poids du modèle et le code source, et le nombre de paramètres varie de 7 à 70 milliards. Meta a déclaré que Llama 2 surpasse d'autres modèles linguistiques open-source sur de nombreuses mesures externes, y compris le raisonnement, le codage, la compétence et les tests de connaissance.
Au cours du développement de Llama 2, une plus grande attention a été accordée à la responsabilité. Les développeurs ont testé à nouveau les modèles et créé un système de transparence qui détaille les problèmes éventuels.
En outre, ils ont inclus un guide d'utilisation responsable ainsi qu'une politique d'utilisation acceptable afin d'éviter les abus tels que les activités criminelles, les représentations trompeuses et le spam.
Microsoft fournit le modèle par l'intermédiaire du catalogue Azure AI pour une utilisation dans des outils basés sur le cloud tels que le filtrage de contenu. L'outil peut également fonctionner directement sur les PC Windows et sera disponible par l'intermédiaire de fournisseurs externes tels qu'Amazon Web Services et Hugging Face.
La première version du modèle était open source, mais était destinée exclusivement aux universitaires et aux chercheurs. Llama 2 permet aux entreprises de personnaliser la technologie à leurs propres fins, par exemple pour créer des chatbots ou des générateurs d'images. Cela permet aux entreprises de bénéficier du modèle et aux développeurs tiers de le tester pour vérifier qu'il n'est pas biaisé, inexact et qu'il ne présente pas d'autres défauts.