SPRIGHT
Lösung zur Verbesserung der räumlichen Konsistenz in Text-zu-Bild-Modellen
Normales ProduktBildText-zu-BildRäumliche Konsistenz
SPRIGHT ist ein umfangreicher visueller Sprachdatensatz und ein darauf basierendes Modell, das sich auf räumliche Beziehungen konzentriert. Der SPRIGHT-Datensatz wurde durch die Neubebeschreibung von 6 Millionen Bildern erstellt, wodurch die Anzahl räumlicher Ausdrücke in den Beschreibungen deutlich erhöht wurde. Das Modell wurde auf 444 Bildern mit vielen Objekten feinabgestimmt, um die Generierung von Bildern mit räumlichen Beziehungen zu optimieren. SPRIGHT erreicht in mehreren Benchmark-Tests den neuesten Stand der Technik in Bezug auf räumliche Konsistenz und verbessert gleichzeitig die Bildqualitätsbewertung.
SPRIGHT Neueste Verkehrssituation
Monatliche Gesamtbesuche
535
Absprungrate
42.79%
Durchschnittliche Seiten pro Besuch
1.0
Durchschnittliche Besuchsdauer
00:00:00