Skip to main content

Midjourney y su riqueza de estilos, tanto internos como aleatorios es innegable. Desde la aparición de los estilos codificados (opción sref) y de los estilos personales (opción p) la eclosión estilística es más que evidente. Parece ser que la tendencia actual es descubrir estilos y usar prompts mucho más simples en lugar de olvidarse un poco de esta moda y seguir avanzando en la elaboración de prompts descriptivos al detalle.

Lo cierto es que algo está pasando dentro de Midourney, me refiero a su motor interpretativo puesto que prompts muy simples como el que veremos a continuación varían enormemente en los resultados aplicando un estilo o no.

Este es el caso:

Good Morning in the ghetto --s 750

Una declaración de principios muy básica. Buenos días en el ghetto. UNo espera ver quizás una taza de café en una mesita en la calle, una calle en decadencia, con gente deambulando, etc. Cualquier cosa similar. El ambiente de un barrio hacinado. Un ghetto, ¿qué otra cosa, no? El primer resultado generado es tal que así:

Cuatro escenas muy similares en cuanto a la perspectiva. Destaca la ausencia de personajes, apenas unos automóviles, nada de gente. ¿Están todavía durmiendo? Quizás. En la imagen 3, es decir, la inferior izquierda, vemos un callejón abandonado, lleno de grafittis. En suma, a pesar de no ver a nadie en las calles podrían pasar por escenas de un ghetto.

¿Qué ocurre cuando le añadimos estilo? Por ejemplo, es estilo personal actual del autor:

Good Morning in the ghetto --s 750 --p 82546na

El cambio es espectacular:

¿Qué ha pasado? Las imágenes no se parecen en nada al conjunto anterior. En tres de ellas aparecen personajes afroamericanos. ¿Por qué? ¿Acaso todos los ghettos del mundo están habitados por gente de color? La imagen 3 (curioso, suele ser la que da siempre la nota) nos recuerda el hacinamiento de ciudades como Kowloon, auténticos ghettos en sí mismas. El realismo es patetene así como el gran contraste de luz y sombras. Aplicando tan sólo el estilo personal aparecen de la nada unos personajes y un ambiente mucho más realista, radical incluso.

Podría pensarse que el estilo personal se ha entrenado con imágenes de gente de color, chcias bonitas, etc. Pero no es así. El estilo personal del autor se basa siempre en un patrón claro: imagen realista frente a ilustración, ilustración bien definida frente a baja resolución, ese es el patrón general. Suelen ignorarse logotipos, imágenes de mal gusto, etc. por lo que el resultado anterior es doblemente sorprendente.

Al margen de esta consideración podemos ver que aplicar estilos codificados tiene su importancia. Un aspecto a tener en cuenta es que igual que se busca la coherencia de personajes entre escenas, para el desarrollo de un comic o una historia, también necesitamos tener una coherencia en el estilo. Si damos con un estilo personal o codificado (sref) que nos satisface al 100% podemos usarlo en todas nuestras generaciones y así darle nuestro toque personal como generadores de imágenes (me abstengo de decir “como artistas”).

A continuación veremos los 9 arquetipos que solemos usar para ilustrar las guías de estilo, aplicando el estilo personal anterior:

Food Truck

Mascota

Montaña

Muscle car

Tetera

Joyería

Retrato

Playa

Ciudad

Cualquiera de estas escenas sería mucho más sencilla sin el estilo aplicado. Por poner un ejemplo:

Playa

Las imágenes están bien pero si las comparamos con la anterior generación con el estilo personal, les falta fuerza y dramatismo. Podemos pensar que el estilo base de Midjourney tiene a lo sencillo y simple, con una mezcla de resultados pictóricos y realistas.

Una forma de ver cómo evoluciona nuestro estilo personal es generar la misma secuencia de imágenes cada vez que terminamos un entrenamiento. Es decir, después de valorar varios centenares de imágenes en los apartados correspondientes, actualmente tres (ranking por estética, exactitud del prompt y niji), generamos el mismo prompt usando un valor de seed fijo y podremos ver la evolución del estilo. A veces el cambio no se percibe pero va tomando forma poco a poco lo que será nuestro estilo personal. Gracias al sistema de códigos personales, que se generan cada vez que valoramos una imagen, tenemos la opción de usar estilos personales anteriores.

Estilo personal del 13 de junio de 2024:

el estilo a día de hoy, 1 de septiembre de 2024:

el prompt es exactamente el mismo, lo únic o que varía es el código –p

Puede verse la evolución a un estilo más pictórico y más contraste. En el camino se han quedado “estilos” muy diversos provocados por una valoración de imágenes sesgada. Por ejemplo, tras valorar exclusivamente por la iluminación de la imagen y no por su contenido, teníamos este estilo el 31 de julio de 2024:

Muy distinto, la verdad.

El sistema de entrenamiento no es precisamente igual que un LORA de Stable Diffusion. Según vemos en las noticias del canal Midjourney en Discord, se está preparando un sistema para poder tener distintos estilos personales entrenados expresamente.