Auf einer kürzlich stattgefundenen Pressekonferenz präsentierte das Alibaba International AI-Team sein neuestes multimodalen Großmodell Ovis. Diese innovative KI-Technologie bietet Branchenweit neue Möglichkeiten. Ovis zeichnet sich durch seine beeindruckenden Fähigkeiten im Bildverständnis und in der Datenverarbeitung aus und sorgt für frischen Wind.
Die multimodale Leistungsfähigkeit von Ovis ist außergewöhnlich. Es kann verschiedene Datentypen wie Text und Bilder verarbeiten und zeigt eine herausragende Gesamtleistung. Im Vergleich zu traditionellen großen Sprachmodellen versteht Ovis nicht nur Text, sondern analysiert auch nicht-textuelle Informationen wie Bilder detailliert.
Beispielsweise kann der Nutzer einfach ein Foto eines Gerichts hochladen, und Ovis erkennt es sofort und liefert detaillierte Kochschritte, die dem Nutzer helfen, leckere Gerichte einfach zuzubereiten.
Ovis kann anhand der Bilderkennung ein Rezept erstellen.
Laut Daten der multimodalen Bewertungsplattform OpenCompass belegt Ovis1.6-Gemma2-9B unter den Modellen mit weniger als 30 Milliarden Parametern den ersten Platz im Gesamtranking und übertrifft Modelle wie MiniCPM-V-2.6. Dieser Erfolg beweist die Wettbewerbsfähigkeit von Ovis auf dem Markt.
Bewertung von Ovis auf OpenCompass.
Darüber hinaus zeigt Ovis hervorragende Leistungen in Bereichen wie mathematischem Schließen, Objekterkennung und komplexen Entscheidungen. Es kann beispielsweise präzise mathematische Aufgaben lösen, Blumenarten erkennen und sogar handschriftliche Texte übersetzen. Zu den fünf Kernvorteilen von Ovis gehören insbesondere das innovative Architekturdesign und die hochauflösende Bildverarbeitung, die seine Leistung bei multimodalen Aufgaben deutlich verbessern.
Die Open-Source-Strategie von Ovis ist ebenfalls lobenswert. Die Lizenz basiert auf der Apache2.0-Lizenz, was bedeutet, dass Nutzer das Modell frei verwenden und verbessern können. Die Modelle und der Code der Ovis-Serie sind auf GitHub öffentlich verfügbar, sodass Entwickler sie einfach abrufen und weiterentwickeln können.
In einer Vielzahl von Anwendungsbereichen, darunter autonomes Fahren, medizinische Diagnostik und Videoanalyse, zeigt das multimodale Großmodell Ovis enormes Potenzial. Das Alibaba International Team gab bekannt, dass die Nachfrage der Händler nach KI in den letzten sechs Monaten stetig gestiegen ist und sich die Aufrufzahlen durchschnittlich alle zwei Monate verdoppelt haben. Ovis wird zweifellos dazu beitragen, die Betriebseffizienz vieler Händler zu steigern.
Wichtigste Punkte:
1️⃣ Ovis ist ein multimodalen Großmodell, das verschiedene Datentypen wie Text und Bilder verarbeiten und herausragende Gesamtleistungen erbringen kann.
2️⃣ Ovis1.6-Gemma2-9B belegt im OpenCompass-Benchmark unter den Modellen mit weniger als 30 Milliarden Parametern den ersten Platz im Gesamtranking und übertrifft zahlreiche leistungsstarke Konkurrenten.
3️⃣ Ovis verwendet die Open-Source-Lizenz Apache2.0. Alle Modelle und der Code sind auf GitHub öffentlich zugänglich und können von Entwicklern frei verwendet und verbessert werden.