Creare immagini con l’intelligenza artificiale (AI)

Come creare immagini con l’intelligenza artificiale, a che punto siamo? Scopri tutti i passaggi in questa guida completa

Se hai visto anche tu le immagini create dall’intelligenza artificiale – e se non le hai viste chi chiediamo dove vivi – il tuo crevello si sara avventurato in un ragionamento tipo questo. C’era un tempo, non così lontano, in cui per creare un’immagine servivano matite, pennelli, macchine fotografiche o, per i più moderni, tavolette grafiche e ore di certosina pazienza. Poi, quasi dal nulla è esplosa l’intelligenza artificiale generativa. Improvvisamente, i nostri feed social, le presentazioni aziendali e persino le chat di gruppo si sono riempite di immagini sognanti, iperrealistiche e bizzarre, tutte partorite da un algoritmo. “Vuoi un gatto astronauta in stile Van Gogh che mangia un gelato su Marte? Dammi due minuti.”

Questa nuova frontiera della creatività digitale ha scatenato un misto tra meraviglia e apprensione. Da un lato, la promessa di democratizzare l’arte, di dare a chiunque il potere di visualizzare l’impossibile; dall’altro, il timore di un futuro dove gli artisti veri, quelli in carne e ossa, finiscono per chiedere l’elemosina ai robot. Ma prima di farci prendere dal panico o dall’euforia, cerchiamo di capire come fa l’intelligenza artificiale a creare immagini.

Creare immagini con l’intelligenza artificiale: cosa c’è dietro questa magia?

Dietro l’apparente stregoneria di un’immagine che nasce da una semplice frase, c’è un concentrato di tecnologia che fino a pochi anni fa era roba da film di fantascienza. Parliamo di machine learning e reti neurali, ovvero software che cercano di imitare il funzionamento del cervello umano. Questi sistemi vengono “addestrati” su database sterminati contenenti miliardi di immagini esistenti, ciascuna accompagnata da una descrizione testuale.

I modelli più in voga oggi, come quelli basati sulle architetture “Diffusion” (tipo Stable Diffusion, DALL-E 3, Midjourney), imparano ad associare le parole ai concetti visivi. In pratica, partono da un “rumore” digitale, una specie di nebbia indistinta, e, guidati dal nostro input testuale (il famoso “prompt”), iniziano a “scolpire” questo rumore, un passettino alla volta, fino a far emergere l’immagine richiesta. Immaginate uno scultore che da un blocco di marmo informe tira fuori una statua, solo che il marmo è digitale e lo scalpello è un algoritmo che ha visto più opere d’arte di qualsiasi critico vivente. Il risultato? A volte un capolavoro, altre volte qualcosa che sembra uscito da un incubo di Dalì dopo una cena pesante.

Come generare immagini con l’AI: istruzioni per l’uso

Se pensate che basti scrivere “gatto” per fare creare all’intelligenza artificiale l’immagine di un felino che fa le fusa dallo schermo, rimarrete delusi. L’arte di dialogare con queste IA, nota con il termine anglofono un po’ pretenzioso di prompt engineering, è una disciplina sottile, a metà tra la poesia e la programmazione.

Bisogna essere specifici, quasi pedanti. Volete un “cane”? Bene, ma di che razza? Cosa sta facendo? Dove si trova? Con che luce? In che stile pittorico? “Un golden retriever cucciolo che dorme beatamente su una poltrona di velluto rosso, illuminato da una luce calda pomeridiana, stile dipinto a olio rinascimentale”. Ecco, così iniziamo a ragionare.

Poi ci sono i negative prompts, ovvero le istruzioni su cosa NON fare: “niente doppie code, per favore”, “evita quell’effetto plasticoso”, “ti scongiuro, non più di cinque dita per mano!”. Il processo è iterativo: si genera, si osserva il risultato, si affina il prompt, si rigenera, e così via, in un loop che può portare all’immagine perfetta o a decidere che, forse, era meglio un disegno fatto a mano. All’inizio, è facile ottenere abomini digitali: quel “gatto su una bicicletta” potrebbe trasformarsi in un groviglio lovecraftiano di pelliccia e metallo a pedali. Ma con un po’ di pratica (e molta pazienza), si può iniziare a domare la bestia algoritmica e iniziare a creare immagini con l’intelligenza artificiale (AI) di qualità.

Luci e ombre: i pro e i contro delle immagini generate dall’AI

Come ogni tecnologia che si rispetti, anche l’AI generativa di immagini porta con sé un bel bagaglio di opportunità e qualche scheletro nell’armadio. Ecco un breve riassunto di quelli che, almeno secondo noi, sono i pro e i contro di questa svolta tecnologica.

I pro:

Democratizzazione della creatività: chiunque, anche chi disegna come un bambino di tre anni, può dare forma visiva alle proprie idee. Serve un logo al volo? Un’illustrazione per un post? Un’ispirazione per un tatuaggio? Chiedi e (forse) ti sarà dato;
Velocità ed efficienza: per designer, creativi e marketer, è uno strumento pazzesco per il brainstorming, per creare moodboard, concept art, prototipi rapidi. Ore di lavoro condensate in pochi minuti;
Nuovi orizzonti estetici: l’IA può mescolare stili, inventare prospettive, creare immagini che un umano potrebbe non concepire, aprendo a forme d’arte inedite;
Divertimento puro: ammettiamolo, richiedere all’IA di disegnare robe assurde è spesso spassoso;

I contro:

L’incubo delle sei dita (e altre amenità): la famigerata “uncanny valley” è sempre in agguato. Mani con troppe o troppo poche dita, volti che si sciolgono come cera, prospettive da mal di mare, oggetti che sfidano le leggi della fisica. A volte, i risultati sono talmente surreali da diventare essi stessi una forma d’arte involontaria.
La fiera del generico: con la facilità d’uso, il rischio è una marea montante di immagini esteticamente piacevoli ma prive di anima, tutte un po’ uguali, un po’ “effetto Midjourney”. Il mondo è ora invaso da gattini cyberpunk con un numero variabile (ma quasi mai corretto) di zampe.
La crisi dell’originalità: se tutti usano gli stessi strumenti e magari anche prompt simili, non rischiamo un appiattimento stilistico?
Ma è arte questa?: il dibattito è aperto e infuocato. Se l’opera la “fa” una macchina, è ancora arte? Chi è l’artista? Colui che scrive il prompt, o l’algoritmo? Mio cugino, che fino a ieri faceva solo meme di dubbia qualità, ora si definisce “un prompt artist internazionale”, con tanto di portfolio su LinkedIn.

E dal punto di vista filosofico?

E qui la faccenda si fa seria, perché le implicazioni vanno ben oltre il numero di dita. Il primo problema, già da tempo centrale all’interno del dibattito sull’intelligenza artificiale, non solo quando viene utilizzata per creare immagini è connesso al Copyright e alla domanda: di chi è l’immagine generata? Dell’utente che ha scritto il prompt? Della società che ha creato l’IA? O è un’opera derivata dalle miriadi di immagini usate per l’addestramento, molte delle quali magari protette da copyright? Al momento, è un Far West legale. E che dire del prompting “nello stile di [artista famoso vivente]”? È omaggio o furto?

C’è poi il tema connesso al lavoro. L’intelligenza artificiale distruggerà il mercato di illustratori, fotografi, grafici o lo renderà soltanto più produttivo. A noi piace essere ottimisti è immaginare un mondo dove l’IA è un potentissimo “assistente creativo”, che libera gli esseri umani dalle task superficiali e ci permette di concentrarci sui compiti di maggior valore.

Chiudiamo con i due principali dilemmi etici. Il primo è spaventoso e riguarda la facilità con cui si possono creare immagini con l’intelligenza false ma realistiche. Foto di eventi mai accaduti, volti di persone appiccicati su corpi di altre. Le implicazioni per quanto riguarda il tema della disinformazione, della manipolazione dell’opinione pubblica e della fiducia nelle fonti sono enormi. Distinguere il vero dal verosimile diventerà sempre più un’impresa.

Infine va ribadito che le IA sono addestrate su dati creati dagli esseri umani. Se questi dati contengono pregiudizi (di genere, etnici, culturali), l’IA li imparerà e li replicherà, magari creando immagini stereotipate o escludendo determinate rappresentazioni. L’algoritmo, insomma, può essere razzista o sessista tanto quanto le società che lo hanno nutrito.

Insomma, la possibilità creare immagini con l’intelligenza artificiale è sicuramente rivoluzionaria, tanto quanto l’invenzione della fotografia o del fotoritocco digitale. Come ci stiamo accorgendo sempre di più l’AI è uno strumento incredibilmente potente, capace di democratizzare la creatività, di accelerare i processi produttivi, ma anche di sollevare interrogativi profondi sulla natura dell’arte, sul lavoro e sulla verità stessa. Come ogni strumento, il suo impatto – benefico o malefico – dipenderà da come sceglieremo di usarlo, di regolarlo e di integrarlo nelle nostre vite. Non è né un demone da esorcizzare né una bacchetta magica che risolverà ogni problema. È, più prosaicamente, un nuovo, potentissimo set di pastelli digitali a disposizione dell’umanità. Preparatevi a un futuro dove, per capire se la foto delle vacanze del vostro amico è reale o “promptata”, servirà un occhio allenato, un secondo caffè e, forse, una laurea honoris causa in filosofia della percezione. Il bello (e il brutto) è appena cominciato.