Auf dem schnelllebigen Gebiet der künstlichen Intelligenz verändert eine von einigen Studenten gegründete Plattform still und heimlich die Spielregeln. Chatbot Arena ist nicht nur die weltweit beachtetste Bewertungsplattform für KI-Systeme, sondern auch ein wichtiger Schauplatz für den Wettbewerb der Technologieriesen.

Das im April 2023 von Studenten der University of California, Berkeley, der Stanford University und der University of California, San Diego, gemeinsam gestartete Projekt revolutioniert die traditionelle Bewertung von KI-Technologien auf beispiellose Weise. Anders als bisherige, trockene mathematische und juristische Tests verwendet Chatbot Arena eine ausserordentlich einfache und aufschlussreiche Methode: Benutzer vergleichen anonym die Antworten zweier KI-Modelle und wählen per Abstimmung die bessere Antwort aus.

Künstliche Intelligenz KI-Bildung

Bildquelle: Das Bild wurde von KI generiert und stammt vom Bildlizenzdienstleister Midjourney.

Von anfänglich 9 Modellen auf mittlerweile über 170 angewachsen und mit über 2 Millionen abgegebenen Stimmen hat das Projekt schnell die Aufmerksamkeit von Technologiekonzernen wie OpenAI, Google und Meta auf sich gezogen. Projektleiter Anastasios Angelopoulos scherzt sogar, seine Freundin habe die täglichen Gespräche über Chatbot Arena bereits satt.

Für diese Technologieunternehmen ist Chatbot Arena wie eine Echtzeit-"Rangliste" und ein "Prüfstein". Joseph Spisak, Director of Product Management bei Meta AI, gibt offen zu, dass jedes Unternehmen darum kämpft, ganz oben zu stehen, denn in diesem entscheidenden Technologiebereich kann jeder noch so kleine Vorsprung enorme Auswirkungen auf den Markt und die Anziehungskraft von Talenten haben.

Kürzlich lieferte sich Googles Gemini-Modell auf der Plattform ein spannendes "Katz-und-Maus-Spiel". Vom 2. auf den 1. Platz gestiegen, erzielte es in mehreren Dimensionen wie Stilkontrolle und Code-Fähigkeiten umfassende Fortschritte und konnte sich im Wettbewerb mit OpenAI behaupten. Diese Echtzeit- und transparente Art des Vergleichs macht den Fortschritt der KI lebendig und interessant.

Interessanterweise wird die Bewertungsmethode von Chatbot Arena von einigen Forschern als "subjektive Bewertung" bezeichnet, aber gerade diese benutzernahe Bewertungsart spiegelt die tatsächliche Leistung der KI-Modelle bestmöglich wider. Die Projektleitung bleibt offen und ermöglicht es den Nutzern, verschiedene subjektive Faktoren herauszufiltern und eine objektivere Bewertung anzustreben.

Derzeit arbeitet das gemeinnützige Projekt an der Entwicklung einer "Wikipedia der KI". Monatlich werden neue Testfragen hinzugefügt und regelmässig werden 20% der Nutzer-Feedback-Daten veröffentlicht, um zur Transparenz und zum Fortschritt der KI-Technologie beizutragen.

In Zeiten rasanten technologischen Wandels definiert Chatbot Arena auf fast cyberpunk-artige Weise die Grenzen des technologischen Wettbewerbs neu. Es ist nicht nur eine Ranking-Plattform, sondern auch ein Spiegel, der die Spitze der Entwicklung der künstlichen Intelligenz widerspiegelt.