Salesforce präsentiert xGen-MM, ein Open-Source-Multimodal-AI-Modell für visuelles Verständnis

Salesforce hat ein Open-Source-Multimodal-AI-Modell namens xGen-MM veröffentlicht. Dieses Modell kann sowohl Text als auch Bilder und andere Datentypen verstehen und generieren und könnte unsere Art, KI zu erforschen und anzuwenden, grundlegend verändern.

Das Salesforce AI-Forschungsteam hat auf arXiv einen Forschungsartikel veröffentlicht, der den xGen-MM-Framework detailliert beschreibt. Dieser Framework umfasst nicht nur vortrainierte Modelle, sondern auch Datensätze und Feinabstimmungscodes. Bemerkenswert ist, dass das größte Modell 4 Milliarden Parameter hat und in mehreren Benchmark-Tests eine beeindruckende Leistung zeigt, die mit vergleichbaren Open-Source-Modellen mithalten kann.

Dieser Schritt, ein hochentwickeltes KI-Modell zu veröffentlichen, steht im Gegensatz zum Trend vieler großer Technologieunternehmen, ihre fortschrittlichen KI-Modelle geheim zu halten. Salesforce erklärt, dass sie durch die Öffnung von Modellen und Datensätzen eine breitere Forschung und Entwicklung fördern wollen. Diese Entscheidung soll mehr Forschern und Entwicklern die Möglichkeit geben, an den Fortschritten der multimodalen KI-Technologie mitzuwirken.

Eine wichtige Innovation von xGen-MM ist seine Fähigkeit, „verflochtene Daten“ zu verarbeiten, d. h. mehrere Bilder und Texte gleichzeitig. Diese Fähigkeit ermöglicht es dem Modell, komplexere Aufgaben zu erledigen, z. B. Fragen zu mehreren Bildern gleichzeitig zu beantworten – wirklich beeindruckend! Solche Anwendungsszenarien könnten in Bereichen wie medizinischer Diagnose und autonomes Fahren von großem Nutzen sein.

Die Veröffentlichung umfasst auch mehrere optimierte Modellversionen, darunter ein grundlegendes vortrainiertes Modell, ein für die Befolgung von Anweisungen feinabgestimmtes Modell und ein „sicherheitsoptimiertes“ Modell, das darauf abzielt, schädliche Ausgaben zu reduzieren. Diese Vielfalt spiegelt die zunehmende Bedeutung des Gleichgewichts zwischen Fähigkeiten und ethischen Aspekten in der KI-Community wider.

Die Veröffentlichung leistungsstarker Modelle führt jedoch auch zu Diskussionen über die potenziellen Risiken und gesellschaftlichen Auswirkungen fortschrittlicherer KI-Systeme. Obwohl Salesforce Sicherheitsoptimierungen vorgenommen hat, um Risiken zu minimieren, bleibt die Frage nach dem Gleichgewicht zwischen Innovation und Sicherheit ein wichtiger Punkt.

Die Open-Source-Veröffentlichung von Salesforce bietet Forschern wertvolle Werkzeuge, um diese leistungsstarken Technologien besser zu verstehen und zu verbessern. Gleichzeitig setzt sie einen neuen Maßstab für Transparenz im KI-Bereich und könnte andere Technologieunternehmen dazu bewegen, ihre Forschung offener zu gestalten.

Modellzugang: https://huggingface.co/collections/Salesforce/xgen-mm-1-models-662971d6cecbf3a7f80ecc2e

Wichtigste Punkte:
🌟 xGen-MM ist ein von Salesforce veröffentlichtes Open-Source-Multimodal-AI-Modell, das das umfassende Verständnis und die Generierung von Text und Bildern unterstützt.
🔍 Das Modell kann verflochtene Daten verarbeiten und Fragen zu mehreren Bildern gleichzeitig beantworten, was vielversprechende Anwendungsmöglichkeiten bietet.
🔒 Die Veröffentlichung umfasst mehrere optimierte Versionen, die sich mit Sicherheits- und ethischen Fragen befassen und Forschern umfassende Ressourcen bieten.

KI-Nachrichten und -Informationen

Salesforce präsentiert xGen-MM, ein Open-Source-Multimodal-AI-Modell für visuelles Verständnis

AIbase基地