En el campo de la IA generativa (AIGC), el arte de las indicaciones de texto es crucial. El lanzamiento del modelo Gen-3 Alpha de Runway ha revolucionado la forma en que controlamos con precisión la IA generativa. Esto no solo representa un triunfo tecnológico, sino también un salto cualitativo en la creatividad y la expresión.

Al usar productos de IA generativa como Gen-3, es posible que descubras que los resultados a veces difieren mucho de lo esperado. Esto suele deberse a que las indicaciones no son lo suficientemente detalladas o precisas. Por ejemplo, una simple indicación como "atardecer en el desierto" es demasiado vaga y no permite que el modelo comprenda tu verdadera intención.

La práctica correcta consiste en proporcionar una descripción visual detallada, como "atardecer en el desierto, la luz dorada del sol baña las ondulantes dunas, una caravana de camellos regresa desde la distancia levantando una considerable cantidad de polvo, estilo realista de alta definición en cámara lenta". Esto permitirá que el modelo capture tu idea con mayor precisión.

Estructura de las indicaciones de texto de Gen-3

Runway recomienda dividir los detalles de la escena, el tema y el movimiento de la cámara en diferentes módulos. Esta estructura clara proporciona los mejores resultados. La estructura de indicación estándar de Gen-3 incluye la indicación de texto para establecer la escena y detalles adicionales, por ejemplo:

Primer plano extremo: Un mini perro curioso de alta definición parado sobre un dedo.

Cambio de escena: Vuelo sobre un castillo irlandés, descubrimiento de los rascacielos de una ciudad cyberpunk futurista.

Si bien Runway Gen-3 ofrece excelentes resultados, su alto precio de suscripción impide que muchos usuarios lo utilicen. Si no quieres pagar la suscripción a Gen-3, no te preocupes, las mismas indicaciones se pueden aplicar a otras herramientas como "Keling" (suponiendo que "可灵" se refiere a una herramienta similar).

Sin embargo, diferentes productos pueden tener lógicas diferentes. Por ejemplo, la indicación "Un mini perro curioso de alta definición parado sobre un dedo" no generará fácilmente el mismo resultado en "Keling". ¿Por qué? Porque la lógica de "Keling" se basa en la realidad, por lo que el perro generado podría no ser tan mini y carecer del efecto realista pero irreal que produce Runway Gen-3.

Por lo tanto, para generar un efecto similar con "Keling", debes modificar ligeramente la indicación, especificando el tamaño del perro.

A continuación, AIbase utilizará esta lógica para replicar una mini cebra en un dedo. La indicación es la siguiente: Un dedo en alta definición, una adorable mini cebra caminando sobre el dedo, tan pequeña como una hormiga, cebra en miniatura.

QQ截图20240709154650.jpg

Y así obtendrás una mini cebra adorable:

Con el mismo método, solo necesitas cambiar el nombre del animal para crear mini pandas, tigres, etc.

Ejemplos detallados de indicaciones proporcionados oficialmente:

Transición fluida

Toma continua FPV de alta velocidad: La cámara vuela sin problemas a través de un cañón glacial hasta un paisaje nuboso de ensueño.

Movimiento de la cámara

Océano brillante por la noche con criaturas bioluminiscentes bajo el agua. La toma comienza con un primer plano extremo de una medusa bioluminiscente, luego se amplía para mostrar todo el océano iluminado con varios colores brillantes bajo las estrellas. Movimiento de la cámara: Comienza con un primer plano extremo de la medusa y luego retrocede y hacia arriba suavemente para mostrar el océano brillante.

Tarjeta de título de texto

Pantalla de título con movimiento dinámico. La escena comienza con una pared pintada con pintura colorida. De repente, la pintura negra fluye por la pared formando la palabra "Runway". Los detalles de la pintura que gotea son ricos, con textura, centrados y con una excelente iluminación cinematográfica.

Palabras clave de la indicación

Las palabras clave ayudan a lograr un estilo específico en la salida. Asegúrate de que las palabras clave sean coherentes con la indicación general para que sean más evidentes en la salida.

Por ejemplo, en una toma de gran angular, si la cámara no puede enfocar estrechamente un rostro, añadir palabras clave sobre la textura de la piel no servirá de mucho. En cambio, añadir más detalles sobre el entorno puede ser muy beneficioso para una toma de gran angular.

Recuerda esta coherencia. A continuación, se muestran diferentes palabras clave que puedes probar al redactar indicaciones: