Meta und Microsoft veröffentlichen Llama 2, ein KI-Sprachmodell für die kommerzielle Nutzung

Von Bohdan Kaminskyi | 18.07.2023, 21:18
Meta und Microsoft veröffentlichen Llama 2, ein KI-Sprachmodell für die kommerzielle Nutzung

Meta und Microsoft haben sich zusammengetan, um Llama 2 vorzustellen, eine neue Generation von Sprachmodellen, die sowohl für kommerzielle als auch für Forschungszwecke entwickelt wurden.

Was wir wissen

Llama 2 wird kostenlos verteilt. Nach Angaben von Meta wurde das Modell mit 40 % mehr Daten trainiert als Llama 1. Die kontextuelle Länge wurde verdoppelt.

Die Veröffentlichung umfasst Modellgewichte und Quellcode, und die Anzahl der Parameter variiert von 7 Milliarden bis 70 Milliarden. Meta sagte, dass Llama 2 andere Open-Source-Sprachmodelle in vielen externen Metriken übertrifft, einschließlich Argumentation, Codierung, Kompetenz und Wissenstests.

Bei der Entwicklung von Llama 2 wurde der Verantwortung mehr Aufmerksamkeit gewidmet. Die Entwickler haben die Modelle erneut getestet und ein Transparenzschema erstellt, das auf mögliche Probleme hinweist.

Darüber hinaus enthalten sie einen Leitfaden für die verantwortungsvolle Nutzung sowie eine Richtlinie zur akzeptablen Nutzung, um Missbrauch wie kriminelle Aktivitäten, irreführende Darstellungen und Spam zu verhindern.

Microsoft stellt das Modell über den Azure-KI-Katalog zur Verwendung in Cloud-basierten Tools wie Content-Filterung zur Verfügung. Das Tool kann auch direkt auf Windows-PCs ausgeführt werden und wird über externe Anbieter wie Amazon Web Services und Hugging Face verfügbar sein.

Die erste Version des Modells war Open Source, aber ausschließlich für Akademiker und Forscher gedacht. Mit Llama 2 können Unternehmen die Technologie für ihre eigenen Zwecke anpassen, zum Beispiel um Chatbots oder Bildgeneratoren zu erstellen. Auf diese Weise können Unternehmen von dem Modell profitieren und Entwickler von Drittanbietern es auf Verzerrungen, Ungenauigkeiten und andere Schwachstellen testen.

Quelle: Meta AI, Engadget.