Nach der weltweiten Aufmerksamkeit, die die Open-Source-Veröffentlichung von DeepSeek R1 ausgelöst hat, haben immer mehr Unternehmen für große Sprachmodelle beschleunigt Deep-Thinking-Modelle vorgestellt und planen deren Open-Source-Veröffentlichung oder haben diese bereits umgesetzt.
Das Alibaba Tongyi-Team hat kürzlich das neue Deep-Thinking-Modell QwQ-Max-Preview vorgestellt, das auch Online-Suchen unterstützt. Dieses Modell ist bereits auf der neuen Website von Tongyi Qianwen (https://chat.qwen.ai/) verfügbar und wird in Kürze Open Source sein.
QwQ-Max-Preview Übersicht
QwQ-Max-Preview basiert auf dem Inferenzmodell Qwen2.5-Max. Qwen2.5-Max ist ein wichtiges, extrem großes MoE-Modell von Alibaba, das mit über 20 Billionen Tokens an Trainingsdaten geschult wurde und in mehreren Benchmark-Tests herausragende Leistungen gezeigt hat, die DeepSeek V3, GPT-4o und andere führende KI-Systeme übertreffen. Dies bildet die solide Grundlage für QwQ-Max-Preview.
Derzeit befindet sich das Modell in der Vorschauphase. Das Alibaba Qwen-Team hat angekündigt, es kontinuierlich zu optimieren. In Zukunft wird die offizielle Version von QwQ-Max veröffentlicht, zusammen mit Apps für Android und iOS. Die Gewichtungen von QwQ-Max und Qwen2.5-Max werden unter der Open-Source-Lizenz Apache2.0 freigegeben. Gleichzeitig ist die Veröffentlichung kleinerer Modelle wie QwQ-32B geplant, die auf lokalen Geräten eingesetzt werden können.
Es unterstützt zwei Kernfunktionen: Deep Thinking und Online-Suche. Im Bereich Deep Thinking kann es komplexe Probleme eingehend analysieren. Die Online-Suchfunktion ermöglicht es dem Modell, seine eigenen Wissensgrenzen zu überwinden und in Echtzeit Informationen aus dem Internet zur Unterstützung der Inferenz abzurufen.
QwQ-Max-Preview Funktionshighlights
- Starke mathematische Fähigkeiten: QwQ-Max-Preview kann dank seiner Deep-Thinking-Funktion verschiedene mathematische Probleme lösen, von grundlegenden Berechnungen bis hin zu komplexen Aufgaben aus Mathematik-Wettbewerben. Es kann den Lösungsweg nachvollziehen und die korrekte Lösung liefern. Beispielsweise kann es bei der Lösung von Problemen zur Bestimmung von Extremwerten in der höheren Mathematik die Eigenschaften der Funktion detailliert analysieren und schrittweise die Extremwerte herleiten.
- Ausgezeichnete Programmierfähigkeiten: Das Modell kann sowohl einfache Skripte erstellen als auch komplexe Anwendungen entwickeln. Wenn es beispielsweise die Aufgabe erhält, "ein p5.js-Skript zu erstellen, das eine rotierende Kugel mit 100 darin hüpfenden gelben Kugeln generiert", kann es detaillierten Code ausgeben und diesen mit Funktionsbeschreibungen versehen.
- Tiefes Denken und logische Analyse: Bei der Bearbeitung logischer Probleme zeigt es einen präzisen Denkprozess. Bei Aufgaben wie "Vater und Tochter sind zusammen 100 Jahre alt, der Vater ist 50 Jahre alt, wie alt ist die Tochter?" kann es nicht nur die mathematische Antwort berechnen, sondern auch die Unvereinbarkeit aus der realen Logik heraus analysieren und verschiedene Möglichkeiten wie Adoption oder Science-Fiction-Elemente vorschlagen, um die Logik des Problems zu verbessern.
- Online-Suche und Informationsintegration: Es kann schnell Informationen im Internet abrufen und diese zur Inferenz verwenden. Bei der Bewertung des Films "Nezha 2" kann es schnell relevante Informationen suchen, diese in seinen Überlegungen und Antworten klar zitieren und Informationen aus verschiedenen Quellen zu einer umfassenden Bewertung zusammenfassen.
- Multimodale Fähigkeiten im Aufbau: Obwohl die aktuelle Vorschauversion dies noch nicht vollständig unterstützt, sind entsprechende Funktionen geplant. Wie in den Beispielen gezeigt, kann es auf die Anforderung "Generiere ein Bild eines Mädchens in einem weißen Kleid und zeige einen QR-Code, der auf taobao.com verweist" reagieren, indem es ein Bild im Anime-Stil mit dem gewünschten QR-Code generiert.
Anwendungsbereiche
- Bildung und Lernen: Schüler können QwQ-Max-Preview verwenden, um bei Problemen in Mathematik, Programmierung und anderen Fächern detaillierte Lösungen und Lösungsansätze zu erhalten und so ihr Lernen zu unterstützen. Beispielsweise kann das Modell bei der Erlernung von Algorithmen helfen, Logikfehler im Code zu analysieren oder Optimierungsvorschläge zu machen.
- Kreative Arbeit: Schriftsteller, Designer und andere Kreative können die Online-Suchfunktion nutzen, um Inspiration zu finden. Schriftsteller können beispielsweise bei der Erstellung von Science-Fiction-Romanen aktuelle wissenschaftliche Informationen suchen, um ihren Werken wissenschaftliche Genauigkeit und Fantasie zu verleihen. Designer können das Modell bitten, Design-Skizzen oder kreative Konzepte zu generieren.
- Spielentwicklung: Spieleentwickler können die Fähigkeiten des Modells nutzen, um neue Spielmechaniken zu entwerfen. Zum Beispiel kann das Modell kreative Lösungen und in gewissem Umfang entsprechenden Code liefern, wenn es darum geht, Tetris und das Spiel 2048 zu kombinieren. Obwohl die Ergebnisse der Vorschauversion möglicherweise fehlerhaft sind, können sie Entwicklern Denkanstöße liefern.
- Lösung alltäglicher Probleme: Menschen können QwQ-Max-Preview für verschiedene Probleme im Alltag verwenden. Bei der Reiseplanung kann es beispielsweise Reiseführer und Informationen zu Sehenswürdigkeiten suchen. Bei der Reparatur von Haushaltsgeräten kann es helfen, die Ursache des Problems und die Reparaturmethode zu finden.
- Branchenforschung: Wissenschaftler, Analysten und andere können das Modell verwenden, um Informationen zu Branchentrends und Spitzentechnologien zu sammeln und so bei der Erstellung von Forschungsberichten und der Analyse von Branchentrends zu helfen.
QwQ-Max-Preview Benutzerhandbuch
- Plattformzugriff: Benutzer können über chat.qwen.ai auf die Qianwen-Chat-Plattform zugreifen.
- Funktionen aktivieren: Nach dem Aufrufen der Plattform finden Sie unten links im Chatfenster die Schaltfläche "Deep Thinking (QwQ)" und die Option "Online-Suche". Klicken Sie auf die Schaltfläche "Deep Thinking (QwQ)", um die Deep-Thinking-Funktion zu aktivieren. Um die Online-Suche zur Unterstützung der Inferenz zu verwenden, aktivieren Sie gleichzeitig die Option "Online-Suche".
- Fragen stellen: Geben Sie im Eingabefeld Ihre Frage präzise und klar ein, z. B. "Analysieren Sie die aktuellen Entwicklungstrends der Branche für Elektrofahrzeuge" oder "Schreiben Sie einen Python-Code, der die Daten sortiert".
- Ergebnisse anzeigen: Das Modell wird nachdenken und die Inferenz durchführen. Wenn die Online-Suche aktiviert ist, werden auch Informationen aus dem Internet integriert, um schließlich eine Antwort zu liefern. Die Antwort kann Textanalysen, Code, Bilder (falls multimodale Funktionen verwendet werden) usw. enthalten. Wenn Sie mit dem Ergebnis nicht zufrieden sind, können Sie Ihre Frage weiter präzisieren und erneut stellen.
Schlussfolgerung
Das von Alibaba vorgestellte Deep-Thinking-Modell QwQ-Max-Preview bietet Benutzern dank seiner hervorragenden Fähigkeiten in Mathematik, Programmierung, Inferenz und seiner einzigartigen Online-Such- und multimodalen Architektur ein völlig neues KI-Erlebnis. Obwohl es sich derzeit in der Vorschauphase befindet und im praktischen Einsatz möglicherweise noch kleine Mängel aufweist, wird es mit der Veröffentlichung der endgültigen Version und kontinuierlichen Optimierung voraussichtlich in vielen Bereichen wie Bildung, Kreativität und Entwicklung einen großen Mehrwert bieten.
Teilen Sie Ihre Erfahrungen und Vorschläge gerne in den Kommentaren und erleben Sie gemeinsam das Wachstum und die Verbesserung dieses Modells. Wir freuen uns auch auf weitere Innovationen von Alibaba im Bereich KI, die uns mit weiteren Überraschungen und Durchbrüchen begeistern werden.