CogVLM
Leistungsstarkes Open-Source-visuelles Sprachmodell
Normales ProduktBildVisuelles SprachmodellBildbeschreibung
CogVLM ist ein leistungsstarkes Open-Source-visuelles Sprachmodell. CogVLM-17B verfügt über 10 Milliarden visuelle Parameter und 7 Milliarden Sprachparameter. CogVLM-17B erzielte in 10 klassischen multimodalen Benchmark-Tests State-of-the-Art-Ergebnisse, darunter NoCaps, Flicker30k Captions, RefCOCO, RefCOCO+, RefCOCOg, Visual7W, GQA, ScienceQA, VizWiz VQA und TDIUC, und erreichte in VQAv2, OKVQA, TextVQA und COCO Captions einen zweiten Platz, wobei es PaLI-X 55B übertraf oder mit diesem vergleichbar war. CogVLM kann auch mit Ihnen über Bilder ins Gespräch kommen.
CogVLM Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34