KI-Nachrichten

Verpassen Sie keinen Moment der globalen KI-Innovation

KI-Tagesübersicht

Tägliche Drei-Minuten-KI-Branchentrends

KI-Zeitleiste

Meilensteine der KI-Industrie

KI-Monetarisierungs-Leitfaden

Neueste Fälle

KI-Monetarisierungsfall-Sharing

Bildersammlung

KI-Bilderstellungs-Monetarisierungsfälle

Videosammlung

KI-Videoerstellungs-Monetarisierungsfälle

Audiosammlung

KI-Audioerstellungs-Monetarisierungsfälle

Inhaltssammlung

KI-Content-Writing-Monetarisierungsfälle

KI-Tutorials

Neueste Tutorials

Kostenlose Weitergabe der neuesten KI-Tutorials

KI-Produkt-Rankings

KI-Produkt-Ranking

Zeigt das Ranking der Gesamtbesuche von KI-Websites

KI-Traffic-Wachstumsranking

Verfolgen Sie die am schnellsten wachsenden KI-Websites nach Traffic

KI-Traffic-Rückgangsranking

Konzentrieren Sie sich auf KI-Websites mit signifikanten Traffic-Einbrüchen

KI-Wochenranking

Zeigt das wöchentliche Besuchsranking von KI-Websites

Beliebte Länder-Rankings

Vereinigte Staaten

KI-Websites, die bei US-Nutzern am beliebtesten sind

China

KI-Websites, die bei chinesischen Nutzern am beliebtesten sind

Indien

KI-Websites, die bei indischen Nutzern am beliebtesten sind

Brasilien

KI-Websites, die bei brasilianischen Nutzern am beliebtesten sind

Beliebte Kategorie-Rankings

Bildgenerierung

Ranking der Gesamtbesuche von KI-Bildgenerierungs-Websites

Persönlicher Assistent

Ranking der Gesamtbesuche von KI-Websites für persönliche Assistenten

Charaktergenerierung

Ranking der Gesamtbesuche von KI-Websites zur Charaktergenerierung

Videogenerierung

Ranking der Gesamtbesuche von KI-Videogenerierungs-Websites

Beliebte Open-Source-Datenrankings

KI-Projektranking

GitHub beliebte KI-Projekte nach Gesamt-Stars

KI-Projektwachstumsranking

GitHub beliebte KI-Projekte nach Wachstumsrate

KI-Entwickler-Ranking

GitHub beliebtes KI-Entwickler-Ranking

KI-Organisationsranking

GitHub beliebtes KI-Organisationsranking

Beliebte Open-Source-Kategorien

Deepseek

GitHub beliebte Deepseek Open-Source-Projekte

TTS

GitHub beliebte TTS Open-Source-Projekte

LLM

GitHub beliebte LLM Open-Source-Projekte

ChatGPT

GitHub beliebte ChatGPT Open-Source-Projekte

KI-Open-Source-Projektbibliothek

Überblick

Überblick über GitHub beliebte KI-Open-Source-Projekte

Produktbibliothek Tool Navigation

CogAgent: Open-Source Visuell-Sprachmodell von Zhipu AI mit GUI-basierter Frage-Antwort-Funktion

站长之家

Veröffentlicht amKI-Nachrichten und -Informationen · 2 Minuten Lesezeit · Dec 21, 2023

159

CogAgent: Ein visuelles Sprachmodell

智谱 AI hat CogAgent, ein visuelles Sprachmodell mit 180 Milliarden Parametern, open source veröffentlicht. CogAgent zeichnet sich durch hervorragende Leistung im Verständnis und der Navigation von grafischen Benutzeroberflächen (GUIs) aus und erreicht in mehreren Benchmark-Tests branchenführende (SOTA) Ergebnisse.

Das Modell unterstützt hochauflösende visuelle Eingaben und dialogbasierte Fragen und Antworten und kann Fragen zu beliebigen GUI-Screenshots beantworten. Darüber hinaus unterstützt CogAgent OCR-bezogene Aufgaben, wobei seine Fähigkeiten durch Pretraining und Feintuning deutlich verbessert wurden.

Benutzer können Screenshots hochladen, um Aufgaben zu lösen und erhalten Informationen zum Plan, zur nächsten Aktion und zu den genauen Koordinaten der jeweiligen Operation.

Visuell-Sprachmodell GUI-basierte Frage-Antwort-Funktion Open Source

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe

Empfohlene verwandte KI-Nachrichten

Wan 2.1, le modèle de génération vidéo open source d'Alibaba, domine les classements dès son lancement et fonctionne de manière fluide sur une carte graphique 4070

Feb 27, 2025

Modèle de génération de vidéo open source Tongyi Wanxiang Wan2.1 : génération de vidéos 480P avec seulement 8,2 Go de VRAM

Tongyi a récemment annoncé la publication en open source de son dernier grand modèle Tongyi Wanxiang, Wan2.1. Wan2.1 est un modèle d'IA axé sur la génération de vidéos de haute qualité. Grâce à ses performances exceptionnelles dans le traitement de mouvements complexes, la reproduction de lois physiques réalistes, l'amélioration de la qualité cinématographique et l'optimisation du respect des instructions, il est devenu l'outil de choix pour les créateurs, les développeurs et les entreprises souhaitant adopter l'ère de l'IA.

Feb 26, 2025