MegaSaM ist ein System, das eine genaue, schnelle und robuste Schätzung von Kameraparametern und Tiefenkarten aus monokularen Videos dynamischer Szenen ermöglicht. Das System überwindet die Einschränkungen herkömmlicher Structure-from-Motion- und monokularer SLAM-Techniken, die typischerweise annehmen, dass das Eingangsvideo hauptsächlich statische Szenen und große Parallaxen enthält. Durch sorgfältig angepasste Modifikationen des Deep-Vision-SLAM-Frameworks kann MegaSaM auf Videos komplexer dynamischer Szenen der realen Welt erweitert werden, einschließlich Videos mit unbekanntem Sichtfeld und unbeschränkten Kamerapfaden. Umfangreiche Experimente mit synthetischen und realen Videos zeigen, dass MegaSaM im Vergleich zu früheren und parallelen Arbeiten eine genauere und robustere Schätzung von Kamerapose und Tiefeninformationen liefert und gleichzeitig eine vergleichbar schnelle oder sogar schnellere Laufzeit aufweist.