Pippo wurde in Zusammenarbeit zwischen Meta Reality Labs und mehreren Universitäten entwickelt und kann aus einem einzelnen, normalen Foto ein hochauflösendes Video mit mehreren Perspektiven generieren. Der Kernvorteil dieser Technologie liegt in der Fähigkeit, hochwertige Videos mit einer Auflösung von 1K ohne zusätzliche Eingaben (wie parametrische Modelle oder Kameraparameter) zu generieren. Es basiert auf einer Architektur mit multiperspektivischem Diffusions-Transformer und bietet vielversprechende Anwendungsmöglichkeiten in Bereichen wie Virtual Reality und Filmherstellung. Der Code von Pippo ist Open Source, enthält aber keine vorab trainierten Gewichte. Benutzer müssen das Modell selbst trainieren.