Im Bereich von AIGC ist die Kunst des Textprompts entscheidend. Die Veröffentlichung des Gen-3-Alpha-Modells von Runway hat eine Revolution darüber ausgelöst, wie man generative KI präzise steuert. Dies ist nicht nur ein technischer Triumph, sondern auch ein Quantensprung in Kreativität und Ausdruck.

Bei der Verwendung von generativen KI-Produkten wie Gen-3 werden Sie möglicherweise feststellen, dass die Ergebnisse manchmal weit von den Erwartungen abweichen. Dies liegt in der Regel daran, dass die Prompts nicht detailliert oder präzise genug sind. Beispielsweise ist der einfache Prompt „Wüsten Sonnenuntergang“ zu ungenau, um dem Modell Ihre wahre Absicht zu vermitteln.

Die richtige Vorgehensweise besteht darin, eine detaillierte visuelle Beschreibung zu liefern, z. B. „Wüste bei Sonnenuntergang, goldenes Sonnenlicht fällt auf die sich erhebenden Sanddünen, eine Kamelkarawane kehrt aus der Ferne zurück und wirbelt Sand auf, hochauflösender Realismus, Zeitlupe“. Dies ermöglicht es dem Modell, Ihre Kreativität genauer zu erfassen.

Die Struktur von Textprompts für Gen-3

Runway empfiehlt, die Details zu Szene, Thema und Kamerabewegung in verschiedene Module zu unterteilen. Diese Struktur ist übersichtlich und liefert die besten Ergebnisse. Die Standard-Prompt-Struktur von Gen-3 umfasst Textprompts zum Aufbau der Szene und zusätzliche Details, wie z. B.:

Nahaufnahme:Ein neugieriger Mini-Hund sitzt auf einem Finger.

Szenenwechsel:Überflug einer irischen Burg, Entdeckung der Wolkenkratzer einer futuristischen Cyberpunk-Stadt.

Runway Gen-3 liefert zwar gute Ergebnisse, aber die hohen Mitgliedsgebühren schrecken viele Benutzer ab. Wenn Sie kein Gen-3-Abo abschließen möchten, ist das kein Problem. Dieselben Prompts können auch auf anderen Plattformen wie z.B. „可灵“ verwendet werden.

Allerdings können die Logiken verschiedener Produkte unterschiedlich sein. So lässt sich der Prompt „Hochauflösendes Bild: Ein neugieriger Mini-Hund sitzt auf einem Finger“ beispielsweise nicht einfach auf „可灵“ anwenden. Warum? Weil die Logik von „可灵“ auf der realen Logik basiert, daher ist der generierte Hund möglicherweise nicht klein genug und erreicht nicht den realistisch-surrealen Effekt von Runway Gen-3.

Um mit „可灵“ einen ähnlichen Effekt zu erzielen, muss der Prompt leicht modifiziert werden. Sie müssen dem großen Sprachmodell mitteilen, wie klein der Hund sein soll.

Im Folgenden zeigt AIbase anhand dieser Logik die Erstellung eines Miniatur-Zebras auf einem Finger. Der Prompt lautet: Ein hochauflösendes Bild: Ein niedliches Miniatur-Zebra läuft auf einem Finger, so klein wie eine Ameise, Miniatur-Zebra

QQ截图20240709154650.jpg

So erhalten Sie ein niedliches Miniatur-Zebra:

Mit dem gleichen Verfahren können Sie durch Ersetzen des Tiernamens verschiedene Miniatur-Pandas, Tiger usw. erstellen.

Hier sind Beispiele für detaillierte Prompts, die von der offiziellen Seite bereitgestellt werden:

Nahtloser Übergang

Kontinuierliche Hochgeschwindigkeits-FPV-Aufnahme: Die Kamera fliegt nahtlos durch eine Gletscherschlucht zu einer traumhaften Wolkenlandschaft.

Kamerabewegung

Leuchtendes Meer in der Nacht mit biolumineszenten Lebewesen unter Wasser. Die Aufnahme beginnt mit einer Nahaufnahme einer leuchtenden Qualle und weitet sich dann auf das gesamte Meer aus, das unter dem Sternenhimmel in verschiedenen leuchtenden Farben erstrahlt. Kamerabewegung: Beginnend mit einer Nahaufnahme der Qualle, sanftes Zurückziehen und Hochziehen, um das leuchtende Meer zu zeigen.

Text-Titelkarte

Titelbildschirm mit dynamischer Bewegung. Die Szene beginnt mit einer mit bunter Farbe bemalten Wand. Plötzlich fließt schwarze Farbe über die Wand und bildet das Wort „Runway“. Die tropfende Farbe ist detailreich, texturiert, zentriert und verfügt über eine hervorragende Filmbeleuchtung.

Schlüsselwörter im Prompt

Schlüsselwörter helfen, einen bestimmten Stil in der Ausgabe zu erzielen. Stellen Sie sicher, dass die Schlüsselwörter mit dem gesamten Prompt übereinstimmen, damit sie in der Ausgabe deutlicher werden.

Beispielsweise ist es bei einer Weitwinkelaufnahme, bei der die Kamera das Gesicht nicht scharf fokussieren kann, nicht sinnvoll, Schlüsselwörter zur Hauttextur hinzuzufügen. Stattdessen könnten mehr Details zur Umgebung einer Weitwinkelaufnahme sehr nützlich sein.

Denken Sie an diese Kohärenz. Hier sind einige verschiedene Schlüsselwörter, die Sie beim Verfassen von Prompts ausprobieren können: