KI-Nachrichten

Verpassen Sie keinen Moment der globalen KI-Innovation

KI-Tagesübersicht

Tägliche Drei-Minuten-KI-Branchentrends

KI-Zeitleiste

Meilensteine der KI-Industrie

KI-Monetarisierungs-Leitfaden

Neueste Fälle

KI-Monetarisierungsfall-Sharing

Bildersammlung

KI-Bilderstellungs-Monetarisierungsfälle

Videosammlung

KI-Videoerstellungs-Monetarisierungsfälle

Audiosammlung

KI-Audioerstellungs-Monetarisierungsfälle

Inhaltssammlung

KI-Content-Writing-Monetarisierungsfälle

KI-Tutorials

Neueste Tutorials

Kostenlose Weitergabe der neuesten KI-Tutorials

KI-Produkt-Rankings

KI-Produkt-Ranking

Zeigt das Ranking der Gesamtbesuche von KI-Websites

KI-Traffic-Wachstumsranking

Verfolgen Sie die am schnellsten wachsenden KI-Websites nach Traffic

KI-Traffic-Rückgangsranking

Konzentrieren Sie sich auf KI-Websites mit signifikanten Traffic-Einbrüchen

KI-Wochenranking

Zeigt das wöchentliche Besuchsranking von KI-Websites

Beliebte Länder-Rankings

Vereinigte Staaten

KI-Websites, die bei US-Nutzern am beliebtesten sind

China

KI-Websites, die bei chinesischen Nutzern am beliebtesten sind

Indien

KI-Websites, die bei indischen Nutzern am beliebtesten sind

Brasilien

KI-Websites, die bei brasilianischen Nutzern am beliebtesten sind

Beliebte Kategorie-Rankings

Bildgenerierung

Ranking der Gesamtbesuche von KI-Bildgenerierungs-Websites

Persönlicher Assistent

Ranking der Gesamtbesuche von KI-Websites für persönliche Assistenten

Charaktergenerierung

Ranking der Gesamtbesuche von KI-Websites zur Charaktergenerierung

Videogenerierung

Ranking der Gesamtbesuche von KI-Videogenerierungs-Websites

Beliebte Open-Source-Datenrankings

KI-Projektranking

GitHub beliebte KI-Projekte nach Gesamt-Stars

KI-Projektwachstumsranking

GitHub beliebte KI-Projekte nach Wachstumsrate

KI-Entwickler-Ranking

GitHub beliebtes KI-Entwickler-Ranking

KI-Organisationsranking

GitHub beliebtes KI-Organisationsranking

Beliebte Open-Source-Kategorien

Deepseek

GitHub beliebte Deepseek Open-Source-Projekte

TTS

GitHub beliebte TTS Open-Source-Projekte

LLM

GitHub beliebte LLM Open-Source-Projekte

ChatGPT

GitHub beliebte ChatGPT Open-Source-Projekte

KI-Open-Source-Projektbibliothek

Überblick

Überblick über GitHub beliebte KI-Open-Source-Projekte

Produktbibliothek Tool Navigation

彩云小梦 V3.5 ist da! Transformer-Effizienz erreicht neue Höhen

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 5 Minuten Lesezeit · Nov 14, 2024

227

Caiyun Technology veranstaltete kürzlich in Peking eine Kommunikationsveranstaltung zum Thema „From Paper to App“ und stellte offiziell das auf der DCFormer-Architektur basierende universelle große Sprachmodell „Yun Jin Tian Zhang“ vor. Gleichzeitig wurde das Upgrade der hauseigenen AI-RPG-Plattform Caiyun Xiaomeng auf die auf DCFormer basierende Version 3.5 angekündigt. Dies markiert einen bedeutenden Durchbruch in der Effizienz der Modellarchitektur im Bereich der künstlichen Intelligenz.

Im Bereich der KI bildet die Transformer-Architektur die zentrale technologische Grundlage für führende große Sprachmodelle wie ChatGPT und Gemini. Caiyun Technology veröffentlichte in diesem Jahr auf der internationalen Top-Konferenz ICML die Arbeit „Improving Transformers with Dynamically Composable Multi-Head Attention“, in der die DCFormer-Architektur erstmalig vorgestellt wurde. Tests zeigen, dass das auf dieser Architektur basierende DCPythia-6.9B-Modell eine Leistungssteigerung um das 1,7- bis 2-fache im Vergleich zu traditionellen Transformer-Modellen erzielt.

Zum Thema der Energieherausforderungen für die KI-Entwicklung wies Caiyun Technology CEO Yuan Xingyuan darauf hin, dass der prognostizierte globale Energieverbrauch für KI bis 2050 das Achtfache der derzeitigen globalen Stromerzeugungskapazität betragen könnte. Nvidia CEO Jensen Huang beschrieb dies noch anschaulicher: Bei derzeitiger Entwicklung würden zukünftig „14 Planeten, 3 Galaxien und 4 Sonnen“ benötigt, um die KI mit Energie zu versorgen.

Caiyun Technology begegnet dieser Herausforderung durch die Verbesserung der zugrundeliegenden Modellarchitektur. DCFormer hebt die feste Bindung der Attention Heads im traditionellen Multi-Head-Attention-Modul (MHA) auf, indem es einen dynamisch kombinierbaren Multi-Head-Attention-Mechanismus (DCMHA) einführt. Dies ermöglicht eine flexiblere, dynamische Kombination und steigert somit die Ausdrucksfähigkeit des Modells erheblich. Diese Innovation brachte Caiyun Technology drei Veröffentlichungen auf der ICML-Konferenz mit einer durchschnittlichen Punktzahl von 7 ein und zählt zu den lediglich zwei chinesischen Unternehmen, die zu einem Vortrag auf der ICML 2024 in Wien eingeladen wurden.

Als erstes Produkt, das auf der DCFormer-Architektur basiert, zeigt die neue Version von Caiyun Xiaomeng eine herausragende Leistung: Sie unterstützt Texteingaben von bis zu 10.000 Zeichen, die Länge der Hintergrundgeschichte kann ebenfalls 10.000 Zeichen erreichen, und die Gesamtflüssigkeit und Kohärenz wurde um 20 % verbessert. Dies bedeutet, dass die KI die Handlungskohärenz besser aufrechterhalten, die Konsistenz der Charaktere bewahren und über die Fähigkeit zur Handlungsreflexion und -korrektur verfügt.

Caiyun Technology, eines der ersten Unternehmen in China, das sich mit großen Sprachmodellen beschäftigt, verfügt derzeit über drei profitabel arbeitende KI-Produkte: Caiyun Weather, Caiyun Xiaomeng und Caiyun Xiaoyi. Das Unternehmen gab bekannt, die Forschungs- und Entwicklungsinvestitionen in DCFormer weiter zu erhöhen, um das traditionelle Modell „ausländische Technologieebene, chinesische Anwendungsebene“ zu durchbrechen und die Positionierung der chinesischen KI-Technologie im globalen Wettbewerb zu stärken.

Durch diesen technologischen Durchbruch demonstriert Caiyun Technology nicht nur die Stärke chinesischer Unternehmen bei Innovationen in der KI-Grundlagenarchitektur, sondern bietet auch neue Ansätze zur Lösung des Energieproblems in der KI-Entwicklung und könnte die nachhaltige Entwicklung der KI-Technologie beschleunigen.

Caiyun Technology Yun Jin Tian Zhang DCFormer AIRPG

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe