Midjourney è il fenomeno del momento per quanto riguarda il mondo dell’illustrazione. Si tratta di un sistema di intelligenza artificiale che, inserendo un gruppo di parole, produce nel giro di pochi secondi una serie di immagini che costituiscono la rappresentazione visuale dell’input testuale.

Ancora una volta i sistemi basati sull’intelligenza artificiale mostrano le loro potenzialità in relazione al mondo delle arti. Le possibilità di uno strumento di questo genere sono molte e il suo utilizzo sta generando un dibattito acceso nel mondo dell’illustrazione e della fumettistica.

Calibrando bene le parole da inserire, Midjourney è in grado di restituire illustrazioni che possono soddisfare alcune richieste specifiche dell’utente; per questo motivo alcuni pensano che l’utilizzo di tecnologie di intelligenza artificiale renderà obsoleto l’intervento dell’illustratore professionista.

Siamo di fronte al solito dilemma: i sistemi di intelligenza artificiale sostituiranno l’essere umano, lasciando illustratori e fumettisti senza lavoro? La paura potrebbe essere confermata da alcuni esperimenti in atto di fumetti disegnati tramite sistemi di intelligenza artificiale, come Prompt: Conversations With Artificial Intelligence di Dave McKean e The abolition of man Carson Grubaugh, in uscita a ottobre, basato sull’omonimo testo di Clive S. Lewis.

D’altro canto, alcuni elementi ci aiutano a ridimensionare il timore che la macchina sostituisca l’essere umano. Il primo di essi è che i sistemi di intelligenza artificiale, per come funzionano oggi, hanno bisogno di un forte intervento umano per dare risultati soddisfacenti.

Bisogna poi considerare che le immagini attualmente prodotte da Midjourney o da altri sistemi di machine learning non sono in grado di raggiungere un livello di qualità e specializzazione uguagliabile a quella dell’essere umano.

Le immagini di Midjourney seguono uno stile abbastanza uniforme e non sono paragonabili a quelle degli illustratori. Un sistema di questo tipo potrebbe allo stato attuale sostituire l’illustratore solo per lavori di qualità non molto alta, permettendo un risparmio economico.

Inoltre, come in altri campi in cui vengono applicati sistemi di intelligenza artificiale, si pongono problemi legali per quanto riguarda il diritto d’autore. Il machine learning, infatti, per funzionare deve attingere a una gran quantità di dati. Bisognerebbe poter risalire alle immagini utilizzate, stabilire la quantità di riuso e di rielaborazione, valutare eventuali diritti d’autore; ma c’è un problema: ricostruire i percorsi di utilizzo dei dati da parte dei sistemi di intelligenza artificiale non è molto facile, nemmeno per chi li crea.

Uno strumento come Midjourney si rivela interessante non tanto per sostituire l’essere umano come illustratore, quanto per verificare in che modo un sistema di intelligenza artificiale sia in grado di visualizzare certi concetti. Midjourney, nutrendosi di un numero elevatissimo di immagini create dall’essere umano, può rappresentare una sorta di coscienza visuale collettiva dell’umanità.

Partendo da questo presupposto, abbiamo provato a nutrire Midjourney con alcuni versi di poesie. Ancora di più in questo contesto la scelta delle parole da inserire è stata decisiva per ottenere risultati soddisfacenti. L’idea di base è stata, comunque, quella di non modificare le poesie. Per questo serviva un poeta in cui la componente visiva fosse forte, ma la cui poesia allo stesso tempo offrisse dei significati che andavano oltre il senso letterale.

Un autore ideale, in questo senso, è Thomas Stearns Eliot, il padre del correlativo oggettivo, una tecnica di scrittura – ripresa poi in Italia da Montale – che considera gli oggetti del mondo reale come dei corrispettivi di idee e concetti astratti, degli oggetti del pensiero.

Questo tipo di poesia può farci capire se i sistemi di machine learning siano in grado solamente di riconoscere parole e accoppiarle a immagini, oppure se possano ricollegare le immagini a dei concetti, creando la giusta atmosfera nell’illustrazione e in alcuni casi riuscendo a rendere in maniera efficace anche il significato che il poeta ha voluto dare agli oggetti di cui parla nelle poesie.

Abbiamo iniziato dando in pasto a Midjourney versi dal poema The Waste Land e i risultati sono stati molto soddisfacenti, ne riportiamo i due esempi più significativi.

Nei versi “Unreal City, / Under the brown fog of a winter dawn, / A crowd flowed over London Bridge”, il poeta descrive una folla di persone che attraversano il London Bridge alle prime luci dell’alba per dirigersi al lavoro. Il testo rimanda all’alienazione dell’essere umano moderno, alla perdita di identità e ai ritmi di vita disumanizzanti. Ecco una delle immagini prodotte da Midjourney a partire da questi versi:

Possiamo notare che Midjourney è riuscito a riprodurre l’ambientazione: la nebbia, il London Bridge e la folla. Gli input testuali sono rispettati e l’atmosfera scelta risulta adatta a descrivere i versi.

C’è un elemento, inoltre, che non è presente tra le parole inserite e che potrebbe suggerirci l’interpretazione data dal poeta: la folla è rappresentata da persone senza volto. Questo rimanda alla disumanizzazione e alla perdita d’identità che il poeta voleva effettivamente rappresentare attraverso questi versi. Come si può spiegare questo?

Si tratta di una coincidenza o di un’abilità del sistema di intelligenza artificiale? I casi sono due: Midjourney potrebbe aver imparato la correlazione senza volto = disumanizzato dai dati usati per l’addestramento e aver collegato sempre attraverso tali dati le parole dei versi al concetto di disumanizzazione; oppure gli esseri umani senza volto sono un elemento finito per altre ragioni nell’illustrazione e che noi colleghiamo a posteriori al concetto di disumanizzazione.

Nel primo caso ci troveremmo di fronte a un risultato davvero interessante, ma in entrambe le possibilità bisogna notare che Midjourney è stato in grado, in questo caso specifico, di rappresentare gli elementi presenti nel testo di input e di inserirne altri che vanno nella giusta direzione per l’interpretazione corretta dei versi, restituendoci un’immagine che può effettivamente diventare un’utile illustrazione al testo.

Un secondo esempio conferma questa tendenza all’interpretazione e, anzi, ci mostra qualcosa di ancora più interessante. Abbiamo inserito il primo verso del poema The Waste Land: “April is the cruellest month”. Si tratta in questo caso di poche parole, che non forniscono immagini precise. L’unico riferimento è semmai temporale, al mese di aprile. A differenza dell’esempio precedente, ci troviamo davanti a un verso che non ha molto di visivo. Ecco una delle immagini prodotte:

Ciò che stupisce è che Midjourney abbia creato per questo verso delle immagini che contengono alcuni elementi che troviamo nei versi successivi, come i fiori che spuntano dal terreno, le tombe che rimandano all’idea della morte: “April is the cruellest month, breeding / Lilacs out of the dead land, mixing / Memory and desire, stirring / Dull roots with spring rain”.

È come se l’intelligenza artificiale avesse riconosciuto l’input testuale e nel rappresentarlo lo avesse completato con le immagini presenti nei versi successivi. In realtà “April is the cruellest month” è uno dei più famosi della letteratura inglese e dunque l’inserimento di elementi presenti nei versi successivi si può spiegare col fatto che gli autori umani delle illustrazioni di cui Midjourney si nutre conoscevano la poesia nella sua interezza.

Inserendo su Google Immagini il verso “April is the cruellest month” appaiono infatti i fiori, le tombe e la pioggia. La potenza di Midjourney, in questo caso, sembra quella di saper combinare un’immagine in grado di riassumere in maniera efficace tutti gli elementi desunti dalle immagini circolanti in rete.

Gli esempi mostrano come la scelta dell’input risulti determinante e laddove azzeccata sembri in grado di attivare meccanismi estremamente interessanti sul funzionamento di Midjourney. Come in altri casi, il sistema di intelligenza artificiale si presenta come un ottimo strumento di implementazione e di elaborazione.

Più che preoccuparci del pericolo che esso ci sostituisca, dovremmo cercare di sfruttare al meglio l’idea dei sistemi di intelligenza artificiale come un’estensione della nostra mente, un ampliamento delle nostre capacità, dalle quali d’altronde deriva.

In collaborazione con Daniel Raffini

Condividi: