Google Gemini Exp 1114: Sensationsauftritt! Übertrifft GPT-4 im ersten Vergleich und erreicht Spitzenpositionen in mehreren Leistungsbewertungen

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 4 Minuten Lesezeit · Nov 15, 2024

621

Die experimentelle Version (Exp1114) von Googles DeepMind Gemini hat auf der Chatbot Arena Plattform bemerkenswerte Ergebnisse erzielt. Nach mehr als einer Woche Community-Tests zeigen über 6000 abgegebene Stimmen, dass das neue Modell seine Konkurrenz deutlich übertrifft und in mehreren Schlüsselbereichen beeindruckende Fähigkeiten demonstriert.

In der Gesamtbewertung belegt Gemini-Exp-1114 mit über 40 Punkten einen hervorragenden ersten Platz gemeinsam mit GPT-4-latest und übertrifft damit die bisher führende Version GPT-4-preview. Noch beeindruckender ist, dass das Modell in Kernbereichen wie Mathematik, komplexen Anweisungen und kreativem Schreiben die Spitze erreicht und somit seine außergewöhnliche Gesamtleistung unter Beweis stellt.

Im Einzelnen zeigt sich der Fortschritt von Gemini-Exp-1114 besonders deutlich:

Im Gesamtranking Sprung vom 3. auf den 1. Platz

Mathematische Fähigkeiten: Aufstieg vom 3. auf den 1. Platz

Verarbeitung komplexer Anweisungen: Steigerung vom 4. auf den 1. Platz

Kreatives Schreiben: Verbesserung vom 2. auf den 1. Platz

Bildverarbeitung: ebenfalls führender Platz

Programmierfähigkeit: Verbesserung vom 5. auf den 3. Platz

Google AI Studio hat diese neue Version offiziell veröffentlicht, damit Nutzer sie ausprobieren können. Die Community äußert jedoch auch Bedenken hinsichtlich bestimmter Punkte, wie z. B. der weiterhin bestehenden Beschränkung auf 1000 Token und der Handhabung von sehr langen Textausgaben in der Praxis.

Branchenexperten sehen in diesem Durchbruch einen Beweis dafür, dass sich Googles langfristige Investitionen im Bereich KI auszahlen. Interessanterweise bleibt das Modell in der Steuerung des Stils auf Platz 4, was darauf hindeuten könnte, dass das Entwicklungsteam hauptsächlich neue Nachtrainingsmethoden verwendet hat, anstatt das vortrainierte Modell zu verändern.

Dieser bedeutende Fortschritt hat auch eine Diskussion über die Branchenstruktur ausgelöst. OpenAI hat in der Vergangenheit oft neue Produkte veröffentlicht, wenn Wettbewerber wichtige Updates herausgebracht haben. Das Ausmaß des Fortschritts von Google ist jedoch so groß, dass die Branche überrascht ist. Es wird vermutet, dass dies auf die bevorstehende Veröffentlichung von Gemini 2 hindeuten könnte und dass Googles Wettbewerbsfähigkeit im Bereich der großen Sprachmodelle deutlich zunimmt.

OpenAI veröffentlicht GPT-4O-Audio-Preview: Sprachsteuerung mit Emotionserkennung!

OpenAI setzt erneut Maßstäbe in der KI-Technologie mit dem neuen Modell gpt-4o-audio-preview. Dieses Modell beeindruckt nicht nur durch seine Fähigkeiten in der Sprachgenerierung und -analyse, sondern eröffnet auch neue Möglichkeiten für die Mensch-Maschine-Interaktion. Werfen wir einen genaueren Blick auf die Eigenschaften und potenziellen Anwendungen dieses innovativen Modells. Die Kernfunktionen von gpt-4o-audio-preview lassen sich in drei Bereiche unterteilen: Erstens erzeugt es auf Basis von Text natürliche und flüssige Sprachantworten, was Anwendungen wie Sprachassistenten und virtuellen Kundenservice zugutekommt.

Amerikacup-Segeln visualisiert Wind mit KI

Bei der 37. America's Cup wurde das Programm WindSightIQ erstmals in die Fernsehübertragung integriert. Mithilfe von Lidar, Sensorfusion und wissenschaftlichen Berechnungen visualisiert es das Windfeld als Augmented- und Virtual-Reality-Grafiken und hilft Zuschauern, die entscheidenden Windfaktoren beim Segeln zu verstehen. Obwohl die Segler weiterhin auf ihr Instinkt und ihr Training angewiesen sind, um Routen zu planen, können Kommentatoren und Zuschauer nun Windmuster in Echtzeit sehen, tatsächliche Leistungen mit optimalen Pfaden vergleichen und so auf einer nie dagewesenen Ebene am Rennen teilnehmen. Diese Innovation bietet ein völlig neues Seherlebnis und macht den normalerweise unsichtbaren Wind sichtbar.

OpenAI neues Modell gpt-4o-2024-08-06 und gpt-4o-mini unterstützen strukturierte Ausgaben

OpenAI hat in seiner API die Funktion für strukturierte Ausgaben hinzugefügt, um sicherzustellen, dass die generierten Ausgaben vollständig dem vorgegebenen JSON-Schema entsprechen. Dies erhöht die Zuverlässigkeit der API und die Genauigkeit der Anwendungen deutlich. Diese Funktion definiert nicht nur die Struktur des JSON, sondern gewährleistet auch die Genauigkeit der Ausgabe. Gleichzeitig wurden die Preise gesenkt: Die Eingangs-Kosten wurden halbiert und die Ausgabe-Kosten um ein Drittel reduziert. Die Einführung strukturierter Ausgaben behebt die Einschränkungen von JSON-Schemas bei der Gewährleistung der Konformität der Ausgaben mit einer bestimmten Struktur und verbessert die Leistung des Modells bei strukturierten Ausgaben erheblich. Durch technologische Innovationen, wie z.B. Beschränkungen...

OpenAI veröffentlicht neues Modell gpt-4o-64k-output-alpha: GPT-4o API unterstützt nun bis zu 64K Output

Das herausragende Merkmal des neuen OpenAI-Modells gpt-4o-64k-output-alpha ist die Möglichkeit, bis zu 64K Tokens in einem einzigen Output zu generieren. Dies eignet sich ideal für die Erstellung umfangreicher und detaillierter Inhalte und erfüllt die Anforderungen von Schreibaufgaben, Programmierung und komplexen Datenanalysen. Diese Funktion erhöht jedoch den API-Preis: Die Kosten für eine Million Output-Tokens betragen 18 US-Dollar, im Vergleich dazu kosten eine Million Input-Tokens nur 6 US-Dollar. Dies soll den hohen Rechenkosten entsprechen und einen verantwortungsvollen Umgang mit diesem leistungsstarken Tool fördern. Das Modell ist für die Bereiche Kreativität und Forschung konzipiert.