智谱AI开源端侧大型语言和多模态模型GLM-Edge系列

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 3 Minuten Lesezeit · Nov 30, 2024

278

Zhihu Technology hat kürzlich die Open-Source-Veröffentlichung seiner GLM-Edge-Serie von Edge-basierten Large Language und Multimodal-Modellen angekündigt. Dieser Schritt markiert einen wichtigen Versuch des Unternehmens, die Modelle in realen Anwendungsszenarien auf Endgeräten zu implementieren. Die GLM-Edge-Serie besteht aus vier Modellen unterschiedlicher Größe: GLM-Edge-1.5B-Chat, GLM-Edge-4B-Chat, GLM-Edge-V-2B und GLM-Edge-V-5B. Sie sind jeweils optimiert für mobile Plattformen wie Smartphones und Infotainmentsysteme im Auto sowie für Desktop-Plattformen wie PCs.

Zhihu AI

Aufbauend auf den technologischen Errungenschaften der GLM-4-Serie hat das Zhihu-Forschungsteam die Modellarchitektur und -größe angepasst, um ein optimales Gleichgewicht zwischen Modellleistung, Echtzeit-Inferenz und Implementierungsfreundlichkeit zu erreichen. Durch die enge Zusammenarbeit mit Partnern und Inferenzoptimierungen zeigt die GLM-Edge-Serie auf einigen Endgeräteplattformen eine außergewöhnliche Geschwindigkeit. Insbesondere auf der Qualcomm Snapdragon 8 Elite Plattform, unter Nutzung der NPU-Rechenleistung und einer gemischten Quantisierungslösung, erreichen das 1,5B-Chatmodell und das 2B-Multimodalmodell eine Dekodierungsgeschwindigkeit von über 60 Tokens pro Sekunde. Mit der Anwendung von spekulativer Stichprobennahme erhöht sich die Dekodierungsgeschwindigkeit sogar auf über 100 Tokens pro Sekunde.

Die Open-Source-Veröffentlichung der GLM-Edge-Serie von Zhihu demonstriert nicht nur die technologische Kompetenz des Unternehmens im Bereich der künstlichen Intelligenz, sondern bietet Entwicklern und Forschern auch leistungsstarke Werkzeuge und Ressourcen zur Förderung der Entwicklung und Innovation von KI-Anwendungen auf Endgeräten.

GLM-Edge Sammlung:

https://modelscope.cn/collections/GLM-Edge-ff0306563d2844

阿里巴巴国际开源 Ovis2 系列多模态大型语言模型 – 共六个版本

Ovis2 ist die neueste Version der Ovis-Modellreihe des internationalen Teams von Alibaba. Im Vergleich zur Vorgängerversion 1.6 wurden bei Ovis2 sowohl die Datenkonstruktion als auch die Trainingsmethoden deutlich verbessert. Es wurde nicht nur die Leistungsdichte kleiner Modelle verstärkt, sondern auch die Fähigkeit zum Chain-of-Thought (CoT)-Schlussfolgern durch Instruktionsfeinabstimmung und Präferenzlernen erheblich gesteigert. Darüber hinaus wurde Ovis2 um die Verarbeitung von Videos und mehreren Bildern erweitert und die Mehrsprachigkeit sowie die OCR-Fähigkeiten in komplexen Szenarien verbessert, wodurch die Praktikabilität des Modells deutlich gesteigert wurde.

智谱AI搜索重大升级：链式思维+深度阅读，开启信息检索新时代

智谱科技最近发布了一款基于链式思维的全新AI搜索工具，其强大的功能引起了业界的广泛关注。这款工具不仅整合了网页深度阅读和多步骤推理能力，还能与智谱的其他AI工具无缝衔接，为用户带来前所未有的搜索体验。继OpenAI发布O1和O1mini模型之后，链式思维和模型推理能力的价值得到了广泛认可。这些技术在事实核查和复杂问题解决方面展现出巨大的潜力。在众多应用场景中，搜索无疑是...

金山办公推出WPS AI写作助手，提高办公效率

金山办公最近推出了一款基于AI Agent范式驱动的WPS AI写作助手功能，旨在提高办公效率和写作体验。该功能支持添加云文档、网页等参考资料，用户只需输入标题，系统便能在0.5秒内理解用户意图并续写内容。WPS AI写作助手基于大型语言模型的人工智能办公应用，采用AI Agent范式与WPS编辑器的深度结合，实现无需用户编写提示词的自动化办公辅助。用户只需提供初始...

智源发布下一代检索增强大型语言模型框架 MemoRAG

Das Beijing Institute for Artificial Intelligence (BAAI) und die GaoLing School of Artificial Intelligence der Renmin Universität in China haben gemeinsam ein innovatives KI-Modellframework namens MemoRAG veröffentlicht. Dieses Framework basiert auf Langzeitgedächtnis und zielt darauf ab, die Entwicklung von Retrieval Augmented Generation (RAG) Technologien voranzutreiben, um komplexere Aufgaben zu bewältigen, die über einfache Fragen und Antworten hinausgehen.