KI-Nachrichten

Verpassen Sie keinen Moment der globalen KI-Innovation

KI-Tagesübersicht

Tägliche Drei-Minuten-KI-Branchentrends

KI-Zeitleiste

Meilensteine der KI-Industrie

Al hardware

die artillerie der artillerie

KI-Monetarisierungs-Leitfaden

Neueste Fälle

KI-Monetarisierungsfall-Sharing

Bildersammlung

KI-Bilderstellungs-Monetarisierungsfälle

Videosammlung

KI-Videoerstellungs-Monetarisierungsfälle

Audiosammlung

KI-Audioerstellungs-Monetarisierungsfälle

Inhaltssammlung

KI-Content-Writing-Monetarisierungsfälle

KI-Tutorials

Neueste Tutorials

Kostenlose Weitergabe der neuesten KI-Tutorials

KI-Produkt-Rankings

KI-Produkt-Ranking

Zeigt das Ranking der Gesamtbesuche von KI-Websites

KI-Traffic-Wachstumsranking

Verfolgen Sie die am schnellsten wachsenden KI-Websites nach Traffic

KI-Traffic-Rückgangsranking

Konzentrieren Sie sich auf KI-Websites mit signifikanten Traffic-Einbrüchen

KI-Wochenranking

Zeigt das wöchentliche Besuchsranking von KI-Websites

Beliebte Länder-Rankings

Vereinigte Staaten

KI-Websites, die bei US-Nutzern am beliebtesten sind

China

KI-Websites, die bei chinesischen Nutzern am beliebtesten sind

Indien

KI-Websites, die bei indischen Nutzern am beliebtesten sind

Brasilien

KI-Websites, die bei brasilianischen Nutzern am beliebtesten sind

Beliebte Kategorie-Rankings

Bildgenerierung

Ranking der Gesamtbesuche von KI-Bildgenerierungs-Websites

Persönlicher Assistent

Ranking der Gesamtbesuche von KI-Websites für persönliche Assistenten

Charaktergenerierung

Ranking der Gesamtbesuche von KI-Websites zur Charaktergenerierung

Videogenerierung

Ranking der Gesamtbesuche von KI-Videogenerierungs-Websites

Beliebte Open-Source-Datenrankings

KI-Projektranking

GitHub beliebte KI-Projekte nach Gesamt-Stars

KI-Projektwachstumsranking

GitHub beliebte KI-Projekte nach Wachstumsrate

KI-Entwickler-Ranking

GitHub beliebtes KI-Entwickler-Ranking

KI-Organisationsranking

GitHub beliebtes KI-Organisationsranking

Beliebte Open-Source-Kategorien

Deepseek

GitHub beliebte Deepseek Open-Source-Projekte

TTS

GitHub beliebte TTS Open-Source-Projekte

LLM

GitHub beliebte LLM Open-Source-Projekte

ChatGPT

GitHub beliebte ChatGPT Open-Source-Projekte

KI-Open-Source-Projektbibliothek

Überblick

Überblick über GitHub beliebte KI-Open-Source-Projekte

Produktbibliothek Tool Navigation

Alibaba Cloud veröffentlicht das bahnbrechende große Sprachmodell Qwen2.5-Turbo – liest zehn Romane am Stück, 4,3-fache Steigerung der Inferenzgeschwindigkeit!

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 4 Minuten Lesezeit · Nov 19, 2024

819

Alibaba Cloud präsentiert das erheblich verbesserte große Sprachmodell Qwen2.5-Turbo mit einer beeindruckenden Kontextlänge von 1 Million Token. Was bedeutet das? Das entspricht etwa 10 Ausgaben von „Die drei Körper“, 150 Stunden Sprachtranskription oder 30.000 Zeilen Code! Das „Lesen von zehn Romanen am Stück“ ist jetzt tatsächlich Realität!

Das Qwen2.5-Turbo-Modell erreicht eine Genauigkeit von 100 % bei der Passkey-Retrieval-Aufgabe und übertrifft vergleichbare Modelle wie GPT-4 im Verständnis langer Texte. Im RULER-Benchmark für lange Texte erzielte es einen hohen Wert von 93,1, während GPT-4 nur 91,6 und GLM4-9B-1M 89,9 Punkte erreichten.

Neben der Verarbeitung extrem langer Texte bietet Qwen2.5-Turbo auch präzise Ergebnisse bei der Bearbeitung kurzer Texte. In Benchmarks für kurze Texte schneidet es vergleichbar mit GPT-4o-mini und Qwen2.5-14B-Instruct ab.

Durch die Verwendung eines Sparse-Attention-Mechanismus verkürzt Qwen2.5-Turbo die Verarbeitungszeit des ersten Tokens für 1 Million Tokens von 4,9 Minuten auf 68 Sekunden – eine Steigerung der Inferenzgeschwindigkeit um das 4,3-fache.

Die Kosten für die Verarbeitung von 1 Million Tokens betragen nur 0,3 RMB. Im Vergleich zu GPT-4o-mini können mit den gleichen Kosten 3,6-mal mehr Inhalte verarbeitet werden.

Alibaba Cloud bietet eine Reihe von Demos für Qwen2.5-Turbo, die die Anwendungsmöglichkeiten in Bereichen wie dem tiefen Verständnis langer Romane, der Code-Unterstützung und dem Lesen mehrerer wissenschaftlicher Arbeiten zeigen. Beispielsweise konnte das Modell nach dem Hochladen der 690.000 Token umfassenden chinesischen Ausgabe der „Drei Körper“-Trilogie eine englische Zusammenfassung der Handlung jedes Romans erstellen.

Die leistungsstarken Funktionen von Qwen2.5-Turbo können über den API-Service des Alibaba Cloud Model Studio, die HuggingFace Demo oder die ModelScope Demo getestet werden.

Alibaba Cloud kündigte an, das Modell weiter zu optimieren, die Ausrichtung der menschlichen Präferenzen bei lang sequenziellen Aufgaben zu verbessern, die Inferenzeffizienz zu steigern, die Rechenzeit zu verkürzen und an der Einführung noch größerer und leistungsfähigerer Modelle mit langem Kontext zu arbeiten.

Offizielle Einführung: https://qwenlm.github.io/blog/qwen2.5-turbo/

Online-Demo: https://huggingface.co/spaces/Qwen/Qwen2.5-Turbo-1M-Demo

API-Dokumentation: https://help.aliyun.com/zh/model-studio/getting-started/first-api-call-to-qwen

Qwen2.5-Turbo Alibaba Cloud Großes Sprachmodell Kontextlänge

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe

Empfohlene verwandte KI-Nachrichten

Modellkontextlänge erreicht 10.000.000 – das Aus für Gründer?

Das von Google veröffentlichte Gemini 1.5 Pro-Modell mit einer Kontextlänge von 10 Millionen Token hat eine Diskussion über die Zukunft der RAG-Technologie ausgelöst. Manche meinen, dass die Eingabe langer Texte die meisten Probleme von RAG lösen und RAG sogar ersetzen könnte. Andere sind der Ansicht, dass RAG auch in Zukunft eine wichtige Rolle spielen wird, da lange Texteingabe nach wie vor Probleme in Bezug auf Kosten und Effizienz aufwirft. Googles Vorteil in Bezug auf Rechenleistung ermöglicht es dem Unternehmen, bei der Erforschung der Kontextlänge führend zu sein. Dieser Artikel prognostiziert...

Feb 27, 2024

610