SPRIGHT

Lösung zur Verbesserung der räumlichen Konsistenz in Text-zu-Bild-Modellen

Normales ProduktBildText-zu-BildRäumliche Konsistenz
SPRIGHT ist ein umfangreicher visueller Sprachdatensatz und ein darauf basierendes Modell, das sich auf räumliche Beziehungen konzentriert. Der SPRIGHT-Datensatz wurde durch die Neubebeschreibung von 6 Millionen Bildern erstellt, wodurch die Anzahl räumlicher Ausdrücke in den Beschreibungen deutlich erhöht wurde. Das Modell wurde auf 444 Bildern mit vielen Objekten feinabgestimmt, um die Generierung von Bildern mit räumlichen Beziehungen zu optimieren. SPRIGHT erreicht in mehreren Benchmark-Tests den neuesten Stand der Technik in Bezug auf räumliche Konsistenz und verbessert gleichzeitig die Bildqualitätsbewertung.
Website öffnen

SPRIGHT Neueste Verkehrssituation

Monatliche Gesamtbesuche

535

Absprungrate

42.79%

Durchschnittliche Seiten pro Besuch

1.0

Durchschnittliche Besuchsdauer

00:00:00

SPRIGHT Besuchstrend

SPRIGHT Geografische Verteilung der Besuche

SPRIGHT Traffic-Quellen

SPRIGHT Alternativen