En el capítulo anterior vimos algunas herramientas para generar imágenes utilizando inteligencia artificial. Es un campo que avanza rápidamente, con la aparición de nuevos modelos e interfaces casi a diario. No obstante, un aspecto esencial y que permanece más o menos inalterado es el uso de prompts o instrucciones específicas para trabajar con la IA. A continuación vamos a ver cómo escribir un buen prompt para generar imágenes.
¿Qué es un prompt?
En términos generales un prompt es la instrucción o descripción detallada que se proporciona a un sistema de IA para que genere un resultado específico. Esta entrada puede ser una pregunta, una declaración o una solicitud específica que se proporciona al modelo para obtener una respuesta o generar contenido.
En el caso de los modelos generativos de imágenes como Stable Diffusion, el prompt es un conjunto de palabras que le indican al modelo qué imagen debe crear. Cuanto más claro y detallado sea el prompt, mejor será la imagen generada, ya que la IA recibirá instrucciones más precisas.
¿Cómo escribir un buen prompt para generar imágenes?
La elección de un prompt adecuado es importante para obtener resultados precisos y útiles. Un buen prompt debe ser detallado y específico. Un buen sistema para conseguirlo es cubrir la mayoría de las siguientes categorías.
1. Asunto
Es el tema principal de la imagen. Puede ser un paisaje, un objeto, una persona o una situación específica. Cuanto más detallado sea el asunto, más preciso será el resultado.
2. Medio
El medio se refiere a la técnica artística que imitará la imagen. Se puede pedir que la imagen parezca hecha con óleo, acuarela, lápiz, o incluso estilo fotográfico. Ejemplos de prompts con medio pueden ser: «pintura al óleo de un bosque nevado» o «ilustración digital de una nave espacial en el espacio». Esto le dará al modelo una idea clara de cómo debe parecer la imagen final.
3. Estilo
El estilo es clave para definir la estética de la imagen. Puede variar desde un estilo realista hasta algo más surrealista, impresionista o incluso minimalista. Por ejemplo, “un retrato en estilo barroco, con detalles ornamentales y luces dramáticas” generará una imagen muy diferente de “una ilustración minimalista en blanco y negro de una ciudad moderna”.
4. Artista
Esta es una de las categorías más potentes para definir una imagen, y al mismo tiempo una de las más polémicas. Incluir el nombre de un artista en el prompt hará que la IA imite el trabajo del mismo. Esto ha dado lugar a un debate intenso y aún no resuelto sobre los límites éticos y legales de la inteligencia artificial.
5. Resolución
Términos como high detail, 4K o high definition en el prompt hacen referencia a la calidad y nivel de detalle de la imagen. No debe confundirse con el tamaño de la imagen, ya que este viene determinado por otros parámetros relacionados con el modelo de difusión utilizado.
6. Color
Añadir términos relacionados con el color en el prompt modificará la coloración general de la imagen. Por ejemplo, se puede especificar “Dibujo hecho a mano de un astronauta de pie sobre la luna. La combinación de colores debe incluir predominantemente tonos de rojo». Esto permitirá que la IA ajuste el resultado a la atmósfera especificada.
7. Iluminación
Describir cómo son la luz y las sombras en la escena afecta drásticamente al aspecto general de la imagen. Términos como iluminación cinemática, sombras duras, volumétrica, efecto rayo, luz solar, luz indirecta, etc. permiten obtener imágenes más realistas y definidas.
En definitiva, un prompt bien estructurado que abarque la mayoría de estas categorías permitirá obtener resultados más precisos y satisfactorios al generar imágenes mediante inteligencia artificial.