Google veröffentlicht das Basis-Weltmodell Genie mit 11 Milliarden Parametern

雪球App

Veröffentlicht amKI-Nachrichten und -Informationen · 2 Minuten Lesezeit · Feb 27, 2024

144

Am 26. Februar veröffentlichte das Google DeepMind-Team Genie, ein grundlegendes Weltmodell – eine interaktive, virtuell generierte Umgebung mit 11 Milliarden Parametern. Es wurde mit Videodaten trainiert und kann Fotos, Skizzen und sogar steuerbare virtuelle Welten generieren. Im Gegensatz zu traditionellen KI-Systemen, die mit manuell beschrifteten Bildern trainiert werden, wurde Genie ohne jegliche Aktionsmarkierungen trainiert. Das bedeutet, Genie musste die Merkmale und Muster verschiedener Aktionen selbstständig aus den Videos extrahieren. Die von Genie generierten Videos sind cartoonartig und können Roboterbewegungen und sich verformende Objekte simulieren. Im Vergleich zu Sora konzentriert sich Genie eher auf animierte Grafiken. Google beschreibt Genie als herausforderndes Projekt, das feinkörnige Steuerung erlernen und aus Internetvideos lernen kann. Genie kann außerdem verschiedene potenzielle Aktionen simulieren und basierend auf der generierten Umgebung verschiedene Aktionen vorhersagen.

KI-Traffic-Fresser: ChatGPT unter den Top 10 der weltweiten Websites, teilt aber kaum Traffic

Laut den neuesten Daten von Similarweb erreichte ChatGPT im Februar 2025 mit 390,5 Millionen Besuchen einen Rekordwert, ein leichter Anstieg von 1,44 % gegenüber Januar. Obwohl das monatliche Wachstum nachgelassen hat, verzeichnete ChatGPT im Vergleich zum Februar 2024 immer noch ein starkes jährliches Wachstum von 137 %. Dieses anhaltende Wachstum hat ChatGPT im globalen Website-Ranking weiter nach oben gebracht. Derzeit belegt es Platz 5 unter den weltweiten Desktop-Websites und Platz 7, wenn Desktop- und mobiler Traffic kombiniert werden. Die Daten zeigen, dass ChatGPT einen erheblichen Teil des globalen Internetverkehrs beansprucht.

LanPaint: Lokale Neulackierungsmethode für Inferenz, Bildreparatur ohne Training

Der Entwickler scraed hat kürzlich auf GitHub LanPaint veröffentlicht, ein Werkzeug zur Bildreparatur ohne zusätzliches Training. Dieses Tool soll Nutzern helfen, hochwertige Bildreparaturergebnisse auf jedem stabilen Diffusionsmodell (SD) zu erzielen, einschließlich selbst trainierter, benutzerdefinierter Modelle. LanPaint erzielt durch mehrfache Iterationen, die das Modell vor dem Entrauschen „nachdenken“ lassen, nahtlosere und genauere Reparaturergebnisse. Ein Hauptmerkmal von LanPaint ist die Reparatur ohne Training. Benutzer können sofort...

QQ Browser Launches AI Q&A Feature: Yuanbao Quick Answer, Powered by HunYuan's Fast Thinking Model Turbo S

On March 7th, QQ Browser announced the launch of its AI Q&A feature—Yuanbao Quick Answer—designed to provide users with faster and more concise search results. This feature leverages Tencent's HunYuan 'Fast Thinking' model Turbo S, incorporating search enhancement technology to quickly retrieve real-time information from across the web, including high-quality content from official accounts, and automatically extracts key information to deliver clear and concise answers to users.

KI-Nachrichten und -Informationen

Google veröffentlicht das Basis-Weltmodell Genie mit 11 Milliarden Parametern

雪球App

Empfohlene verwandte KI-Nachrichten

KI-Traffic-Fresser: ChatGPT unter den Top 10 der weltweiten Websites, teilt aber kaum Traffic

LanPaint: Lokale Neulackierungsmethode für Inferenz, Bildreparatur ohne Training

QQ Browser Launches AI Q&A Feature: Yuanbao Quick Answer, Powered by HunYuan's Fast Thinking Model Turbo S

KI-Unterricht startet an allen Pekinger Grund- und Mittelschulen im Herbstsemester