CogVLM

Leistungsstarkes Open-Source-visuelles Sprachmodell

Normales ProduktBildVisuelles SprachmodellBildbeschreibung
CogVLM ist ein leistungsstarkes Open-Source-visuelles Sprachmodell. CogVLM-17B verfügt über 10 Milliarden visuelle Parameter und 7 Milliarden Sprachparameter. CogVLM-17B erzielte in 10 klassischen multimodalen Benchmark-Tests State-of-the-Art-Ergebnisse, darunter NoCaps, Flicker30k Captions, RefCOCO, RefCOCO+, RefCOCOg, Visual7W, GQA, ScienceQA, VizWiz VQA und TDIUC, und erreichte in VQAv2, OKVQA, TextVQA und COCO Captions einen zweiten Platz, wobei es PaLI-X 55B übertraf oder mit diesem vergleichbar war. CogVLM kann auch mit Ihnen über Bilder ins Gespräch kommen.
Website öffnen

CogVLM Neueste Verkehrssituation

Monatliche Gesamtbesuche

474564576

Absprungrate

36.20%

Durchschnittliche Seiten pro Besuch

6.1

Durchschnittliche Besuchsdauer

00:06:34

CogVLM Besuchstrend

CogVLM Geografische Verteilung der Besuche

CogVLM Traffic-Quellen

CogVLM Alternativen