OSI veröffentlicht neuen Open-Source-AI-Standard: Trainingsdaten müssen offengelegt werden

Kürzlich veröffentlichte die Open Source Initiative (OSI) eine neue Definition, die präzisiert, was als wirklich „Open Source“ Künstliche Intelligenz gilt. Dieser neue Standard hat die Aufmerksamkeit von Technologieriesen auf sich gezogen, insbesondere Metas Llama-Modell, da es diese Regeln nicht erfüllt. Die OSI war stets der Standardsetzer für Open-Source-Software, doch bei KI-Systemen gibt es Elemente, wie z. B. die Trainingsdaten des Modells, die von traditionellen Lizenzen nicht abgedeckt werden.

Laut der neuen Definition der OSI muss jedes KI-System, das als wirklich Open Source gilt, drei Dinge bereitstellen: Erstens detaillierte Informationen über die zur Schulung der KI verwendeten Daten, damit andere die Ergebnisse verstehen und reproduzieren können; zweitens den vollständigen Code zum Erstellen und Ausführen der KI; und drittens die Einstellungen und Gewichte während des Trainings, die die Ergebnisse der KI beeinflussen.

Großes Modell Code Internet

Bildquelle: Das Bild wurde mit KI generiert, Bildrechte liegen bei Midjourney.

Diese Regelung stellt eine direkte Herausforderung für Metas Llama-Modell dar. Obwohl Llama öffentlich heruntergeladen und verwendet werden kann, unterliegt es Einschränkungen für kommerzielle Zwecke und stellt keine Trainingsdaten bereit, wodurch es die Open-Source-Standards der OSI nicht erfüllt. Metas Sprecherin Faith Eischen erklärte, dass sie mit der OSI in vielen Punkten übereinstimmen, aber in Bezug auf diese Definition unterschiedlicher Meinung seien. Sie betonte, dass die Definition von „Open-Source-KI“ nicht einfach sei, da traditionelle Definitionen die Komplexität heutiger, sich schnell entwickelnder KI-Modelle nicht abdecken.

Stefano Maffulli, Geschäftsführer der OSI, erklärte, dass sie zwei Jahre lang mit Experten weltweit an der Entwicklung dieses Standards gearbeitet haben. Sie führten intensive Gespräche mit Experten aus der Wissenschaft, dem Bereich des maschinellen Lernens und der Verarbeitung natürlicher Sprache sowie mit Content-Erstellern, um eine umfassende Lösung zu erreichen.

Metas Begründung für den eingeschränkten Zugriff auf die Trainingsdaten liegt hauptsächlich in Sicherheitsbedenken, doch Kritiker vermuten dahinter eher die Reduzierung der rechtlichen Haftung und den Schutz von Wettbewerbsvorteilen. Die Trainingsdaten vieler KI-Modelle enthalten mit ziemlicher Sicherheit urheberrechtlich geschütztes Material. Gegenwärtig häufen sich die Klagen gegen Unternehmen wie Meta und OpenAI, wobei die Kläger nur auf indirekte Beweise zurückgreifen können, um zu belegen, dass ihre Werke verwendet wurden.

Maffulli sieht die aktuelle Situation als ähnlich zu vergangenen Ereignissen. Er erinnert sich an die Haltung von Microsoft gegenüber Open Source in den 1990er Jahren und ist der Ansicht, dass Meta seine Technologie aus ähnlichen Gründen abschottet. Für sie sind die Trainingsdaten die „Geheimwaffe“.

Wichtigste Punkte:
🌐 Die neue Definition der OSI verlangt von KI-Systemen die Bereitstellung von Trainingsdaten, Code und Einstellungen, um die Standardisierung von „Open AI“ voranzutreiben.
🦙 Metas Llama-Modell wird aufgrund der fehlenden Bereitstellung von Trainingsdaten als nicht Open Source eingestuft und steht in der Kritik der Branche.
⚖️ Zunehmende Rechtsstreitigkeiten: Meta und andere KI-Unternehmen werden aufgrund der Verwendung urheberrechtlich geschützter Materialien von verschiedenen Seiten verklagt, wobei die rechtliche Haftung im Mittelpunkt steht.

KI-Nachrichten und -Informationen

OSI veröffentlicht neuen Open-Source-AI-Standard: Trainingsdaten müssen offengelegt werden – ist Metas Llama Pseudo-Open-Source?

AIbase基地

Empfohlene verwandte KI-Nachrichten

Sicherheitslücke entdeckt! Ollama-Großmodell-Tool weist schwerwiegende Schwachstelle auf

智谱 AI gibt Unterstützung für GLM-4-9B und CodeGeeX4-ALL-9B in Ollama bekannt

Ollama 0.2 veröffentlicht: Parallelität standardmäßig aktiviert – mehrere Anfragen gleichzeitig bearbeiten und mehrere Modelle laden