Cos’è Sora e come cambia il mondo del design?

Chiara ZoiaChiara Zoia
Sora cos'è e come cambia il mondo del design2

Sora è l’ultima, clamorosa novità nel mondo dell’intelligenza artificiale generativa e delle sue applicazioni nell’ambito del design e della creatività. L’ha presentata a metà febbraio l’azienda che l’ha sviluppata, OpenAi. Esatto, proprio quella che ha già messo sul mercato ChatGPT, DALL-E e altro ancora.

La tecnologia è sempre basata su comandi in forma di testo, o prompt. Ma con la sorprendente capacità, a partire da queste istruzioni, di generare intere scene video.

In pratica produce, a partire da quello che viene scritto (prompt testuali) dei video. Quello che si può capire per adesso di Sora è abbastanza sorprendente, nonostante abbiamo ormai fatto l’abitudine alla sempre crescente precisione degli strumenti di intelligenza artificiale.

Così Lorenzo ha girato un video in cui ti racconta un po’ il suo punto di vista: è questo qui.

Qui di seguito riprendiamo gli argomenti che ha trattato Lorenzo e cerchiamo di chiarire al meglio cos’è questa nuova tecnologia e quali sono i possibili scenari che apre nel mondo del graphic design.

Cos’è Sora

Sora è un motore di intelligenza artificiale generativa: crea video di circa un minuto a partire da prompt testuali. Per arrivare a questo risultato OpenAi ha combinato tecnologie e metodi già testati per i suoi prodotti più conosciuti. Come per DALL·E 3 sono state create, come prima cosa, moltissime didascalie di testo per accompagnare il materiale video con cui addestrare Sora. ChatGPT è poi subentrata per convertire i prompt degli utenti, che magari sono brevi e poco dettagliati, in istruzioni molto più ricche e precise, che permettono di produrre video di miglior qualità.

In effetti è proprio la qualità dei primi test presentati da OpenAI, che trovi tutti raccolti nella landing page dedicata a Sora, a lasciare sbalorditi e meritare qualche ragionamento più approfondito.

Cosa fa Sora

Questo qui sopra è un video totalmente generato da un’intelligenza artificiale. Da Sora. A partire dal prompt: “Historical footage of California during the gold rush.“.

Sostanzialmente è questo che fa Sora: genera un video a partire da quello che viene scritto.

Però… come?

Cominciamo con una precisazione: al momento la stragrande maggioranza delle persone non può accedere a Sora. Solo ricercatori o comunque creator selezionati che lavorano a stretto contatto con OpenAI hanno la possibilità di accedere e di generare i video.

La scelta di limitare l’accesso in questa fase, che è ancora di test, ha molte ragioni, tra cui alcune di carattere pratico.

Innanzitutto ci sono ancora tante questioni etiche irrisolte: non le affrontiamo qui, per non andare troppo fuori tema, ma in concreto un accesso aperto senza regole precise potrebbe voler dire per OpenAI dover gestire un sacco di problemi legali.

Poi c’è una questione di costi e gestione tecnologica. Far accedere centinaia di migliaia di persone da tutto il mondo a generare video su video senza limitazioni richiede un sacco di risorse: energetiche, tecnologiche appunto, come server, schede video, processori, etc. E risorse in termine di personale e competenze per gestire tutto quanto. Insomma: costi molto alti.

Il fatto di non aver aperto l’accesso però, significa anche che non abbiamo ancora una vera possibilità di capire come questa tecnologia funzioni in mano a un’utenza media. A chi non fa parte del team di sviluppo o comunque non ha una conoscenza approfondita delle IA generative.

Una cosa simile, in realtà, l’abbiamo già vista con il lancio di Gemini (la IA di Google). In pratica non sappiamo, ad esempio, quanti input di prompt sono serviti per arrivare ai risultati che vediamo.

Questo però non significa che non esistano le premesse per arrivare a risultati eccezionali. Andiamo allora a vedere, in pratica, cosa ha prodotto Sora.

Video di qualità strabiliante

Alcuni dei video che sono stati resi pubblici fanno meravigliare per qualità di texture, capacità di riprodurre superfici, luci, effetti cinematografici.

Certo, ma fanno anche un po’ paura sapendo che è tutto finto, che è tutto generato al computer. Prendiamo ad esempio il video con protagonisti degli astronauti; il prompt è questo “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.

Come puoi vedere il video generato da Sora non presenta nessuno dei difetti che siamo abituati a considerare normali in quello che le IA producono. Non solo sono perfetti la pelle, i capelli, ma persino i movimenti sono naturali e non ci sono quelle allucinazioni tipo mani con troppe dita o bocche con 62 denti.

Anche la battaglia di navi pirata in una tazza di caffè (prompt: Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee) ha un risultato davvero perfetto. Oltre che dal punto di vista della qualità della resa delle immagini, anche perché Sora ha interpretato in maniera impeccabile l’intenzione della richiesta fatta attraverso il prompt.

La stessa cosa vale anche quando la richiesta non è quella di un video fotorealistico, ma piuttosto di quello che possiamo definire un prodotto di animazione in 3D.

In questo caso quello che colpisce sono le espressioni del viso del protagonista, un tenero mostriciattolo, molto dinamiche e convincenti. A voler proprio essere pignoli, una piccola allucinazione c’è: nella zampa sembra ci sia una goccia di cera di candela che non dovrebbe esserci.

Difetti e imperfezioni

Eppure non tutto ancora risulta sempre convincente. Ci sono comunque dei difetti qui e là: camminate strane ad esempio. Non so se ci hai fatto caso: nel video di lancio con la ragazza che cammina in una strada di Tokyo, se fai molta attenzione, noterai che i suoi piedi a un certo punto fanno un doppio passo con un saltello, quasi un passo di tip tap senza alcun senso.

Le imprecisioni sembrano riguardare soprattutto gli effetti di movimento più complessi: in un video un cane passa da un davanzale all’altro e sembra attraversare le persiane, mentre avrebbe dovuto aggirarle.

Cosa succede quando Sora gestisce prompt diversi

Per dare spazio alla curiosità della maggioranza delle persone, che ancora non possono accedere, il CEO di OpenAI, Sam Altman, ha pubblicato un post su X (l’ex Twitter) per chiedere ai suoi follower di fornire dei prompt che poi ha dato in pasto al motore di Sora. Anche in questo caso i risultati sono per alcuni versi sorprendenti, per altri più deludenti.

Sora sembra molto precisa quando si tratta di riprodurre la realtà. È il caso del tutorial di cucina, dove il prompt chiedeva di creare una sorta di video tutorial di come si fanno gli gnocchi, preparati da una nonna social media influencer in Toscana. Nel video generato sembra non mancare niente; in pratica a una prima visione è quasi impossibile notare difetti.

È stato chiesto poi di creare un video di due golden retriever che fanno un podcast su una montagna. Qui il risultato è sensazionale, stupendo; anche perché la scena, di per sé, è del tutto non-sense, quindi non è strano trovarci cose bizzarre.

Ma quando la richiesta diventa del tutto fantastica, come quella di generare due volte con lo stesso prompt una sorta di creatura immaginaria, metà drago metà papera con un criceto vestito in modo avventuroso sulla schiena, il risultato è più goffo.

Ci sono a grandi linee gli elementi richiesti, ma ad esempio questa specie di drago alato vola all’indietro.

Cosa succede adesso?

Cambia tutto!

Ma, in pratica, che conseguenze hanno queste novità? Cos’è che dobbiamo aspettarci e quali scelte dovrebbe fare chi si lavora nel mondo del graphic design?

La prima cosa da sottolineare è che non possiamo pensare che non cambierà niente. Siamo di fronte a un salto tecnologico superlativo, che avrà di certo un forte impatto.

Un esempio che puoi già toccare con mano? La rivoluzione nel mercato di materiale di stock. Con IA generative di questa potenza non avrà più nessun senso andare a cercare, che so, “cielo in movimento in un giorno di primavera”. È di sicuro più veloce e facile farlo creare dall’intelligenza artificiale. Questo fenomeno è già così evidente che Adobe ha cambiato le formule di acquisto su Adobe Stock; oggi infatti i crediti per comprare materiale si possono spendere sia per il materiale già caricato sulla piattaforma, sia per generare nuovo materiale.

Non cambia la sostanza

C’è una cosa che accomuna tutto quello che abbiamo visto finora fare dalle intelligenze artificiali generative come Sora. Per quanto si possa imparare a usare bene i prompt, nessuno può avere il pieno controllo sul risultato. Questo significa che i prodotti che si ottengono non vanno bene in tutti quei casi in cui serve la direzione artistica, l’intenzione creativa. Oppure che devono comunque essere editati in modo pesante: così però si perde il vantaggio della velocità, quindi del minor costo.

Se il mercato non potrà che cambiare, è invece molto probabile che il mestiere del designer non solo non scomparirà, come il resto dei mestieri creativi, ma forse cambierà meno di quanto pensiamo. Di certo bisognerà imparare a usare nuovi strumenti, come però è già successo un sacco di volte: nel mondo degli effetti speciali a inizio anni ’90 o anni 2000 col miglioramento della tecnologia, oppure quando si è introdotto Photoshop nella grafica eccetera eccetera.

In futuro il ruolo del designer diventerà forse un po’ più ibrido (ne avevamo già parlato qui). Non dovrà più occuparsi solo, o per lo più, di creare il materiale di base; piuttosto di selezionare e saper utilizzare gli strumenti giusti per ogni progetto. E da qui ancora selezionare quello che gli strumenti producono.

Conclusioni

Grandi potenzialità, grandi dubbi, grandi scenari e grandi incertezze. Questo è un po’ il panorama che sembra aprirsi di fronte a chi si occupa di graphic design. Di certo viviamo un momento di passaggio, evoluzione ed è quindi sempre più importante puntare sull’aggiornamento e sulla preparazione per avere tutti gli strumenti che servono. Ed è importante mantenere un dialogo: per questo ci fa piacere se condividi qui nei commenti le tue impressioni su queste novità.

Intanto noi abbiamo preso una decisione: ormai il peso delle IA generative è così rilevante da meritare una sezione dedicata nel nostro blog. Continua allora a seguirci per avere altri contenuti e aggiornamenti. Intanto ti saluto

A presto!

Commenti:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*