KI-Nachrichten

Verpassen Sie keinen Moment der globalen KI-Innovation

KI-Tagesübersicht

Tägliche Drei-Minuten-KI-Branchentrends

KI-Zeitleiste

Meilensteine der KI-Industrie

Al hardware

die artillerie der artillerie

KI-Monetarisierungs-Leitfaden

Neueste Fälle

KI-Monetarisierungsfall-Sharing

Bildersammlung

KI-Bilderstellungs-Monetarisierungsfälle

Videosammlung

KI-Videoerstellungs-Monetarisierungsfälle

Audiosammlung

KI-Audioerstellungs-Monetarisierungsfälle

Inhaltssammlung

KI-Content-Writing-Monetarisierungsfälle

KI-Tutorials

Neueste Tutorials

Kostenlose Weitergabe der neuesten KI-Tutorials

KI-Produkt-Rankings

KI-Produkt-Ranking

Zeigt das Ranking der Gesamtbesuche von KI-Websites

KI-Traffic-Wachstumsranking

Verfolgen Sie die am schnellsten wachsenden KI-Websites nach Traffic

KI-Traffic-Rückgangsranking

Konzentrieren Sie sich auf KI-Websites mit signifikanten Traffic-Einbrüchen

KI-Wochenranking

Zeigt das wöchentliche Besuchsranking von KI-Websites

Beliebte Länder-Rankings

Vereinigte Staaten

KI-Websites, die bei US-Nutzern am beliebtesten sind

China

KI-Websites, die bei chinesischen Nutzern am beliebtesten sind

Indien

KI-Websites, die bei indischen Nutzern am beliebtesten sind

Brasilien

KI-Websites, die bei brasilianischen Nutzern am beliebtesten sind

Beliebte Kategorie-Rankings

Bildgenerierung

Ranking der Gesamtbesuche von KI-Bildgenerierungs-Websites

Persönlicher Assistent

Ranking der Gesamtbesuche von KI-Websites für persönliche Assistenten

Charaktergenerierung

Ranking der Gesamtbesuche von KI-Websites zur Charaktergenerierung

Videogenerierung

Ranking der Gesamtbesuche von KI-Videogenerierungs-Websites

Beliebte Open-Source-Datenrankings

KI-Projektranking

GitHub beliebte KI-Projekte nach Gesamt-Stars

KI-Projektwachstumsranking

GitHub beliebte KI-Projekte nach Wachstumsrate

KI-Entwickler-Ranking

GitHub beliebtes KI-Entwickler-Ranking

KI-Organisationsranking

GitHub beliebtes KI-Organisationsranking

Beliebte Open-Source-Kategorien

Deepseek

GitHub beliebte Deepseek Open-Source-Projekte

TTS

GitHub beliebte TTS Open-Source-Projekte

LLM

GitHub beliebte LLM Open-Source-Projekte

ChatGPT

GitHub beliebte ChatGPT Open-Source-Projekte

KI-Open-Source-Projektbibliothek

Überblick

Überblick über GitHub beliebte KI-Open-Source-Projekte

Produktbibliothek Tool Navigation

NVLM-D-72B

Ein hochmodernes, multimodal großes Sprachmodell

Normales ProduktProduktivitätKIMultimodal

Website öffnen

NVLM-D-72B ist ein von NVIDIA entwickeltes großes, multimodales Sprachmodell, das sich auf visuelle und sprachliche Aufgaben konzentriert und durch multimodales Training die Textleistung verbessert. Das Modell erzielte in Benchmarks für visuelle und sprachliche Aufgaben Ergebnisse, die mit denen der branchenführenden Modelle vergleichbar sind.

Website öffnen

NVLM-D-72B Neueste Verkehrssituation

Monatliche Gesamtbesuche

27175375

Absprungrate

44.30%

Durchschnittliche Seiten pro Besuch

5.8

Durchschnittliche Besuchsdauer

00:04:57

NVLM-D-72B Besuchstrend

NVLM-D-72B Geografische Verteilung der Besuche

NVLM-D-72B Traffic-Quellen

NVLM-D-72B Alternativen

NVLM-D-72B — Ein hochmodernes, multimodal großes Sprachmodell

Produktivität

•KI•Multimodal

246

InternVL3 — InternVL3 Open Source: 7 Größen decken Text-, Bild- und Videoverarbeitung ab, Multimodalität erweitert auf industrielle Bildanalyse

Produktivität

•KI•Multimodal

WeClone — Feinabstimmung eines großen Sprachmodells mit WeChat-Chatverläufen zur Erzeugung hochwertiger Sprachklone.

Produktivität

•Digitaler Klon•Sprachklon

Dream 7B — Dream 7B ist eines der leistungsstärksten offenen, diffusionsbasierten großen Sprachmodelle.

Produktivität

•Diffusionsmodell•Großes Sprachmodell

MistralOCR.net — Mistral OCR ist ein leistungsstarkes OCR-Produkt zum Verständnis von Dokumenten, das mit sehr hoher Genauigkeit Text, Bilder, Tabellen und Gleichungen aus PDFs und Bildern extrahieren kann.

Produktivität

•Dokumentenverarbeitung•OCR

258

EgoLife — EgoLife ist ein langfristiges, multimodales und mehrperspektivisches Projekt für einen KI-Assistenten im Alltag, das darauf abzielt, die Forschung zum Verständnis von Langzeitkontexten voranzutreiben.

Produktivität

•KI•Multimodal

102

Magma-8B — Magma-8B ist ein von Microsoft entwickeltes multimodales KI-Modell, das Bild- und Texteingaben verarbeiten und Textausgaben generieren kann.

Bild

•Multimodal•KI

120

DeepSeek Japanisch — DeepSeek ist ein fortschrittliches KI-Sprachmodell, das sich auf logisches Denken, Mathematik und Programmieraufgaben spezialisiert hat und kostenlos nutzbar ist.

Produktivität

•KI•Sprachmodell

234

Magma — Magma ist ein grundlegendes, multimodal einsetzbares Modell, das multimodale Eingaben versteht und verarbeitet und für komplexe Aufgaben und Umgebungen verwendet werden kann.

Produktivität

•Multimodal•KI

204

Grok 3 — Das neueste Flaggschiff-AI-Modell Grok 3 von xAI, mit leistungsstarker Inferenz und multimodaler Verarbeitungsfähigkeit.

Internationale Auswahl

•KI•Inferenz

2304

MedRAX — MedRAX ist ein medizinischer KI-Agent zur Interpretation von Röntgenaufnahmen des Brustkorbs. Er integriert verschiedene Analysewerkzeuge und kann komplexe medizinische Anfragen ohne zusätzliches Training verarbeiten.

Andere

•KI•Medizin

234

Gemini 2.0 Pro — Gemini Pro ist ein von Google DeepMind entwickeltes, leistungsstarkes KI-Modell, das sich auf die Bearbeitung komplexer Aufgaben und Programmierleistung konzentriert.

Internationale Auswahl

•KI•Programmierung

318

MNN Großmodell Android App — Eine voll funktionsfähige Android-Anwendung für ein großes Sprachmodell mit Multimodalitätsunterstützung.

Produktivität

•Großes Sprachmodell•Multimodal

2436

CUA — CUA ist eine universelle Schnittstelle, die eine interaktive grafische Benutzeroberfläche für die digitale Welt bietet.

Weltweit beliebt

•KI•Multimodal

480

Gemini 2.0 Flash Thinking Experiment — Gemini 2.0 Flash Thinking Experiment ist ein verbessertes Inferenzmodell, das seinen Denkprozess visualisiert, um Leistung und Interpretierbarkeit zu steigern.

Produktivität

•KI•Inferenz

222

InternVL2.5-78B-MPO — Dies ist eine Serie fortschrittlicher multimodaler großer Sprachmodelle, die eine herausragende Gesamtleistung aufweisen.

Produktivität

•Multimodal•Großes Sprachmodell

246

MinMo — MinMo ist ein multimodaler großes Sprachmodell für nahtlose Sprachinteraktion.

Chatten

•Sprachinteraktion•Multimodal

228

InternVL2.5-38B-MPO — Die InternVL2.5-MPO-Modellreihe basiert auf InternVL2.5 und der Mixed Preference Optimization (MPO) und bietet herausragende Leistung.

Chatten

•Multimodal•Großes Sprachmodell

324

InternVL2_5-26B-MPO-AWQ — Ein fortschrittliches, multimodal großes Sprachmodell mit herausragender multimodaler Inferenzfähigkeit.

Programmierung

•Multimodal•Großes Sprachmodell

180

VITA-1.5 — VITA-1.5: Ein multimodaler großes Sprachmodell der GPT-4o-Klasse für Echtzeit-Video- und Sprachinteraktion

Programmierung

•Multimodal•Großes Sprachmodell

372

InternVL2_5-26B-MPO — Großes multimodaler Sprachmodell, das die Interaktion zwischen visuellen und sprachlichen Informationen verbessert.

Bild

•Multimodal•Großes Sprachmodell

222

InternVL2_5-8B-MPO-AWQ — Großes multimodales Sprachmodell zur Verbesserung der Interaktion zwischen Bild und Sprache.

Bild

•Multimodal•Großes Sprachmodell

192

InternVL2_5-8B-MPO — Großes multimodales Sprachmodell mit hervorragender Gesamtperformance.

Bild

•Multimodal•Großes Sprachmodell

366

InternVL2_5-4B-MPO-AWQ — Großes multimodales Sprachmodell, optimiert für die Interaktion zwischen Bild und Text.

Bild

•Multimodal•Großes Sprachmodell

204

InternVL2_5-4B-MPO — Großes, multimodales Sprachmodell, das herausragende Gesamtperformanz zeigt.

Bild

•Multimodal•Großes Sprachmodell

204

Valley 2.0 — Multimodales großes Sprachmodell zur Verbesserung der Verarbeitung von Text-, Bild- und Videodaten.

Andere

•Multimodal•Großes Sprachmodell

348

Valley-Eagle-7B — Multimodales großes Sprachmodell zur Verarbeitung von Text-, Bild- und Videodaten.

Produktivität

•Multimodal•Großes Sprachmodell

294

Valley — Multimodales großes Sprachmodell zur Verarbeitung von Text-, Bild- und Videodaten

Bild

•Multimodal•Großes Sprachmodell

366

InternVL2_5-2B-MPO — Fortgeschrittenes multimodales großes Sprachmodell

Bild

•Multimodal•Großes Sprachmodell

138

InternVL2_5-1B-MPO — Multimodales großes Sprachmodell zur Verbesserung des umfassenden Verständnisses von visuellen und sprachlichen Informationen.

Produktivität

•Multimodal•Großes Sprachmodell

270