Google AI hat in Zusammenarbeit mit der University of California das visuelle Sprachmodell PixelLLM vorgestellt. Dieses Modell löst erfolgreich die Herausforderungen der Lokalisierung und Ausrichtung, die bei großen Sprachmodellen auftreten.
Durch eine dichte Ausrichtung erreicht PixelLLM eine präzise Lokalisierung und zeigt in verschiedenen visuellen Aufgaben eine herausragende Leistung. Dies eröffnet neue Möglichkeiten in diesem Bereich.