Perché dovresti usare Midjourney, e qualche dritta per usarlo bene

[Guida aggiornata a Midjourney V7]

Di immagini generate con l’AI ne vediamo ogni giorno, di belle e di brutte, con una predominanza di quelle orribili e imprecise: persone con sei dita, proporzioni sfasate e asimmetrie varie. Senza contare, poi, le immagini di tendenza, che quando escono, come nei casi di action figure e “Studio Ghibli style”, invadono i social. Pure le newsletter. E anche le chat non passano indenne. Vabbè.
È una sorta di Far West digitale, chiunque può creare di tutto, grossomodo. Per la generazione di immagini io ho provato diversi strumenti, partendo un paio di anni fa dalla versione Beta di DALL-E 2 e testando, poi, anche Musavir e Stable Diffusion. Ma solo di Midjourney mi sono innamorato. E anche se all’inizio era soprattutto un “wow, che roba!”, faticavo ad ottenere risultati davvero utili. Semplicemente, non sapevo usarlo. Non che ora riesca a combinarci miracoli, ma dopo un annetto di impegno non nascondo di essere riuscito ad ottenere un certo controllo dello strumento e una certa dimestichezza con lo scrivere i prompt (in inglese, mannaggia).

Le immagini generate sono pezzi unici

Poi c’è la questione dell’unicità. Ci sono molti dubbi e quesiti irrisolti in merito all’originalità e al copyright delle immagini generate, ma una cosa è certa: Midjourney genera immagini statisticamente irripetibili. Ogni volta che gli chiedi qualcosa, è come se pescasse a caso in un calderone di pixel e stili, mescolando il tutto con un pizzico di follia algoritmica. Anche se gli dai in pasto lo stesso identico prompt dieci volte in momenti diversi, o anche successivi l’uno all’altro, otterrai dieci risultati diversi, con variazioni talvolta sottili, talvolta enormi. Tutto questo è causato e garantito da una matrice probabilistica che parte dal rumore iniziale: un punto di partenza totalmente casuale e sempre diverso. Un po’ come le onde generate dal mare, che sono sempre diverse e iniziano ogni volta da un punto di partenza diverso.

Il rumore iniziale

Midjourney, prima di creare la sua opera d’arte digitale, parte da una specie di caos primordiale di pixel a caso, una specie di “nebbia” colorata apparentemente senza senso, un po’ come quando la tua vecchia TV non prendeva il segnale. Questo è il rumore iniziale, un punto di partenza completamente randomico che cambia ogni volta. Quando tu gli dai un prompt (tipo “un unicorno che fa surf su un’onda di spaghetti”), l’algoritmo prende questo casino informe e, passaggio dopo passaggio, lo “de-rumorizza” in modo intelligente, seguendo le tue istruzioni.
È come se da un mucchio di mattoncini Lego sparsi a caso, qualcuno costruisse la scultura che hai chiesto; ma il mucchio iniziale di mattoncini è sempre diverso, quindi la scultura finale ha sempre qualche differenza.

Qualche dritta per prendere confidenza con Midjourney

Ok, fino a qui tutto facile e teorico, ma nella pratica, come si usa Midjourney? Innanzitutto lo si può usare sia dalla versione web classica che tramite Discord; io preferisco questa seconda opzione, mette e a disposizione più opzioni di personalizzazione. Ma a parte questo, ci sono almeno tre attività da padroneggiare:

  1. la precisione del prompt;
  2. gli stili dell’immagine;
  3. conoscere i parametri base.

1. La precisione del prompt

Più dettagliato è il tuo prompt, più è probabile che Midjourney capisca cosa hai in mente (o almeno ci vada vicino). Non limitarti a “un gatto che dorme sul cuscino”, prova con

“un gatto soriano che dorme beatamente su un cuscino di velluto color corallo illuminato da una calda luce dorata”.

Capisci la differenza? Usa descrizioni vivide, costruisci il prompt con parole precise: “cuscino di velluto color corallo” è una descrizione che già si concretizza nella nostra mente, mentre “cuscino” può essere giallo, verde, blu, di seta o cotone. Scrivere prompt per Midjourney è una buona palestra anche per migliorare la propria scrittura.
In questo caso il prompt è

A tabby cat sleeping peacefully on a coral velvet cushion illuminated by a warm golden light.

Ecco i risultati.

Se questa mini guida ti è piaciuta, continua a seguirmi (l’ideale è su LinkedIn), lì condivido aggiornamenti sulla scrittura e sui miei pasticci con l’AI.