Auf einer kürzlich stattgefundenen Gartner IT-Konferenz teilten Analysten eine bemerkenswerte Prognose: Bis 2027 werden 40 % der generativen KI-Lösungen (GenAI) multimodale Integration erreichen und gleichzeitig Text, Bilder, Audio und Video verarbeiten können. Dies stellt einen enormen Sprung im Vergleich zu 1 % im Jahr 2023 dar. Diese Veränderung wird tiefgreifende Auswirkungen auf Unternehmensanwendungen haben.

KI im Gesundheitswesen

Bildquelle: Bild wurde mit KI generiert, Bildrechte liegen bei Midjourney

Erick Brethenoux, Senior Vice President bei Gartner, weist darauf hin, dass die Entwicklung des GenAI-Marktes hin zu multimodalen Modellen dazu beitragen wird, die Beziehungen zwischen verschiedenen Datenströmen zu erfassen und die Vorteile von GenAI in verschiedenen Daten und Anwendungen zu erweitern. Er betont, dass multimodale GenAI Menschen dabei unterstützen kann, mehr Aufgaben in verschiedenen Umgebungen zu erledigen.

Laut dem Gartner Hype Cycle Report für generative KI-Technologien 2024 weisen multimodale GenAI und Open-Source-Large Language Models (LLM) eine sehr hohe Auswirkung auf und werden voraussichtlich innerhalb der nächsten fünf Jahre Unternehmen einen erheblichen Wettbewerbsvorteil und schnellere Marktreaktionen verschaffen. Gartner prognostiziert außerdem, dass domänenspezifische GenAI-Modelle und autonome Agenten innerhalb der nächsten zehn Jahre eine breite Anwendung finden werden.

Analyst Arun Chandrasekaran erwähnt, dass die Navigation im GenAI-Ökosystem für Unternehmen eine Herausforderung darstellen wird, da sich das technologische und Anbieterumfeld schnell verändert. Obwohl sich GenAI derzeit im „Tal der Enttäuschung“ befindet, werden sich die tatsächlichen Vorteile nach dem Abklingen des Hypes zeigen, und die Leistungsfähigkeit wird sich schnell verbessern, sobald die Konsolidierung der Branche beginnt.

Die Transformation durch multimodale GenAI wird Unternehmensanwendungen verbessern und neue Funktionen einführen. Derzeit beschränken sich viele multimodale Modelle auf die Verarbeitung von zwei bis drei Modalitäten, aber es wird erwartet, dass diese Vielfalt in den nächsten Jahren zunehmen wird. Brethenoux erwähnt, dass Menschen im realen Leben Informationen durch die Kombination von Audio, visuellen und sensorischen Eindrücken verstehen, daher ist multimodale GenAI von entscheidender Bedeutung.

Zu Open-Source-Large Language Models (LLM) erklärt Chandrasekaran, dass diese Unternehmen Innovationspotenzial bieten, indem sie die Abhängigkeit von bestimmten Anbietern durch Anpassung, Datenschutz und Sicherheitskontrollen sowie Modelltransparenz verringern. Letztendlich können Open-Source-LLMs kleinere, leichter trainierbare Modelle bereitstellen, die die Kernprozesse von Unternehmen unterstützen.

Domänenspezifische GenAI-Modelle sind für bestimmte Branchen oder Aufgaben optimiert und können die Übereinstimmung von Anwendungsfällen innerhalb von Unternehmen verbessern sowie die Genauigkeit und Sicherheit erhöhen. Chandrasekaran fügt hinzu, dass diese Modelle eine schnellere Wertschöpfung, bessere Leistung und höhere Sicherheit ermöglichen und Organisationen dazu ermutigen, GenAI in einem breiteren Anwendungsbereich einzusetzen.

Autonome Agentensysteme können Ziele ohne menschliches Eingreifen erreichen und nutzen KI-Technologien, um Muster zu erkennen, Entscheidungen zu treffen und Ergebnisse zu generieren. Brethenoux betont, dass autonome Agenten einen großen Sprung in der KI-Fähigkeit darstellen, der zu Verbesserungen im Geschäftsbetrieb und im Kundenerlebnis führen wird. Dies kann auch zu einer Veränderung der Arbeitsweise innerhalb von Organisationen führen, von der Ausführung hin zur Überwachung.

Wichtigste Punkte:

🌟 Bis 2027 werden 40 % der Lösungen für generative KI eine multimodale Integration erreichen, eine deutliche Steigerung gegenüber 2023.

🚀 Multimodale GenAI und Open-Source-Large Language Models werden voraussichtlich innerhalb der nächsten fünf Jahre einen erheblichen Wettbewerbsvorteil bringen.

🔍 Domänenspezifische GenAI-Modelle verbessern die Genauigkeit und Sicherheit von Unternehmensanwendungen und fördern eine breitere Akzeptanz.