OpenAIs neuer Projekt Sora: interner Test eines Bildgenerators, möglicherweise Nachfolger von DALL-E 4?

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 4 Minuten Lesezeit · Feb 10, 2025

215

OpenAI hat kürzlich eine bemerkenswerte Ankündigung gemacht: Neben der bereits verfügbaren Videogenerierungsfunktion wird in ihrem intern getesteten Projekt Sora auch intensiv an einer Bildgenerierungsfunktion gearbeitet. Diese neue Funktion ermöglicht Nutzern einen schnellen Wechsel zwischen Video- und Bildgenerierung und erhöht so die Flexibilität beim kreativen Arbeiten.

Inneren Informationen zufolge wird Sora einen versteckten Umschaltknopf erhalten. Nutzer können in der Eingabeaufforderung zwischen den beiden Modi wechseln. Bei Auswahl der Bildgenerierung wird das System den Nutzer automatisch zur Beschreibung eines Bildes auffordern. Dieses Design soll die Benutzerfreundlichkeit verbessern und die Relevanz und Qualität der generierten Inhalte erhöhen.

Neben der verbesserten Bildgenerierungsfunktion hat Sora auch seine Video-Empfehlungen neu kategorisiert. Die neuen Kategorien „Best“ und „Top“ helfen Nutzern, Inhalte besser zu filtern und zu finden. Die Kategorie „Best“ ähnelt den aktuellen Sonderkanälen, während die Kategorie „Top“ Videos möglicherweise nach der Anzahl der Likes oder nach bestimmten Zeiträumen sortiert. Diese Änderung der Kategorisierung lässt die Nutzer gespannt auf den neuen Empfehlungsmechanismus von Sora warten.

Für DALL-E3-Nutzer ist diese Nachricht sicherlich aufregend, da DALL-E3 seit seiner Veröffentlichung etwas veraltet erscheint, insbesondere im Vergleich zu Mitbewerbern wie Midjourney. Obwohl die Bildgenerierungsfunktion von Sora noch nicht offiziell veröffentlicht wurde, hat die Kategorie „Images Internal“ in der linken Navigationsleiste bereits die Neugier der Nutzer geweckt. Derzeit wird diese Kategorie hauptsächlich für Video-Empfehlungen verwendet, könnte aber zukünftig auch Inhalte zur Bildgenerierung anbieten.

Es wird spekuliert, dass das neue Bildgenerierungsmodell DALL-E4 heißen könnte, OpenAI hat dies jedoch noch nicht bestätigt. Branchenexperten vermuten, dass der Bildgenerator in Sora nicht direkt DALL-E4 verwenden wird, sondern auf dem bestehenden „sora-turbo“-Modell basieren könnte. Darüber hinaus weisen Brancheninsider darauf hin, dass ChatGPT noch keine multimodalen Bildgenerierungsfunktionen auf Basis von GPT-4o bietet, daher ist die Einführung des Sora-Projekts ein bemerkenswerter Fortschritt.

Bemerkenswert ist, dass der Text-zu-Bild-Generator in Sora den Codenamen „papaya“ trägt, was das Projekt noch geheimnisvoller und spannender macht. Ein Jahr und ein halbes nach der Veröffentlichung von DALL-E3 stellt sich die Frage, welche Innovationen das nächste Modell bringen wird – die Neugier ist geweckt.

JD Retail Technology präsentiert die京点点AIGC-Inhaltsgenerierungsplattform – Produktbilder und Marketingtexte mit einem Klick generieren

Am 25. Februar gab das technische Team von JD Retail die offizielle Einführung und vollständige Öffnung seiner selbst entwickelten 京点点AIGC-Inhaltsgenerierungsplattform bekannt. Ziel ist es, E-Commerce-Händlern mithilfe von KI-Technologie eine effiziente und kostengünstige Lösung zur Inhaltsgenerierung zu bieten. Derzeit deckt die Plattform über 20 Kernszenarien ab, die tägliche Aufrufzahl der KI-Funktionen übersteigt 10 Millionen und unterstützt über 350.000 JD-Händler bei der Generierung hochwertiger Produktbilder, Marketingtexte und demnächst auch Hauptvideoinhalte mit nur einem Klick. Dies steigert die Effizienz der Inhaltserstellung deutlich und senkt die Produktionskosten.

Ideogram präsentiert Tool zur Massenproduktion von Bildern: Schluss mit umständlichen Vorgängen, kreative Bilder im großen Stil mit einem Klick

Die KI-Bildgenerierungsplattform Ideogram hat kürzlich eine neue Funktion vorgestellt – ein Tool zur Massenproduktion von Bildern. Dieses Tool ermöglicht es Benutzern, durch Hochladen einer Tabelle mit Prompts und Einstellungen (z. B. Excel-Datei) Bilder in großem Umfang zu generieren. Diese innovative Funktion soll den umständlichen Prozess der Bildgenerierung vereinfachen, die Arbeitseffizienz deutlich steigern und professionellen Designern und Kreativen ein komfortableres创作erlebnis bieten. Bildquelle: Bilder wurden mit KI generiert, Massenproduktion über den Bildlizenzierungsdienstleister Midjourney: Schluss mit der einzelnen Eingabe, Effizienzsteigerung

PanoFree: Eine neue Methode zur Panoramabildgenerierung – Mehrperspektivische Bilder ohne Feinabstimmung

PanoFree ist eine innovative Technik zur Generierung mehrperspektivischer Bilder, die ohne Feinabstimmung Panoramabilder einschließlich Langbildern, 360°-Panoramen und Skybox-Bildern erzeugen kann. Der Kern liegt in einem iterativen Prozess aus Verformung und Reparatur, der Konsistenzprobleme und Artefakte während der Generierung löst und gleichzeitig das Bewusstsein für die verschiedenen Perspektiven verbessert. PanoFree verwendet Techniken wie perspektivenübergreifende Führung, Risikogebietsschätzung, Löschen und symmetrische bidirektionale Führung, kombiniert mit einer leitungsbasierten semantischen und Dichtekontrolle, um die Erhaltung der Szenenstruktur sicherzustellen. Experimente zeigen, dass PanoFree bei Fehl-

KI-Nachrichten und -Informationen

OpenAIs neuer Projekt Sora: interner Test eines Bildgenerators, möglicherweise Nachfolger von DALL-E 4?

AIbase基地

Empfohlene verwandte KI-Nachrichten

JD Retail Technology präsentiert die京点点AIGC-Inhaltsgenerierungsplattform – Produktbilder und Marketingtexte mit einem Klick generieren

Ideogram präsentiert Tool zur Massenproduktion von Bildern: Schluss mit umständlichen Vorgängen, kreative Bilder im großen Stil mit einem Klick

PanoFree: Eine neue Methode zur Panoramabildgenerierung – Mehrperspektivische Bilder ohne Feinabstimmung