Die Stanford University hat das PIGEON-Modell veröffentlicht, ein KI-System, das Bilder mit einer Genauigkeit von über 90% errät. In einem globalen Spiel, bei dem es darum geht, den Ort von Straßenansichten zu erraten, besiegte das Modell die besten menschlichen Spieler. Dieser Erfolg inspirierte die Entwicklung von PIGEOTTO, einem Modell, das die Position beliebiger Bilder bestimmen kann.
Das Forschungsteam nutzte semantische geografische Einheiten, Label Smoothing und den CLIP-Visionstransformer, um einen neuen Durchbruch in der geografischen Ortung von Bildern zu erzielen.