Open AI ha presentato Sora, la nuova frontiera AI nella generazione video

Da mesi stiamo assistendo a grandi rivoluzioni supportate dall’intelligenza artificiale.

Dopo aver sentito cantare Elvis Presley una cover degli AC/DC, ci si può aspettare di assistere presto a significativi progressi anche nel settore dell’intelligenza artificiale applicata ai video.

OpenAI (la società che ha creato ChatGPT)  ha recentemente presentato Sora, il suo ultimo strumento di intelligenza artificiale (AI) progettato per creare video brevi istantaneamente in risposta a comandi scritti, segnando un altro significativo avanzamento nell’intelligenza artificiale generativa. Questa tecnologia non è la prima del suo genere, dato che aziende come Google e Meta hanno precedentemente dimostrato capacità simili.

Questa innovazione apre nuove prospettive non solo per gli sviluppatori e i ricercatori, ma anche per professionisti creativi e ai marketers.

Cosa rende Sora speciale?

Sora è in grado di creare video di durata fino a un minuto, mantenendo al contempo una qualità visiva elevata e un’aderenza precisa ai prompt degli utenti. Questa tecnologia rappresenta un salto qualitativo nel campo dell’AI, offrendo la possibilità di generare scene complesse con più personaggi, tipi specifici di movimento e dettagli accurati sia dei soggetti che dello sfondo.

Interazione con il mondo fisico

Un obiettivo primario di OpenAI è insegnare all’AI a comprendere e simulare il mondo fisico in movimento. Sora è un esempio lampante di questo sforzo, dimostrando un’abilità notevole nel generare contenuti video che riflettono le dinamiche del mondo reale. Il modello possiede una comprensione profonda del linguaggio, che gli permette di interpretare accuratamente i prompt e di generare personaggi espressivi e ricchi di emozioni.

Innovazioni tecniche e sicurezza

Sora utilizza una struttura transformer, simile ai modelli GPT, e rappresenta video e immagini come collezioni di unità di dati minori chiamate patch. Questo approccio consente di addestrare il modello su una gamma più ampia di dati visivi, migliorando significativamente la sua capacità di generazione video.

Sora non è ancora disponibile al pubblico, perché prima di offrila ai suoi utenti, OpenAI sta prendendo seri provvedimenti per garantirne la sicurezza.

OpenAI infatti sta coinvolgendo artisti, responsabili politici e altre parti interessate per raccogliere feedback e condurre test rigorosi per questioni come la disinformazione, i pregiudizi e la generazione di contenuti fuorvianti.

I modelli di recaptioning

Sora incorpora tecniche di recaptioning, che migliorano la sua capacità di seguire le istruzioni testuali degli utenti nei video generati; si tratta di un avanzamento significativo rispetto ai precedenti modelli di OpenAI come DALL·E.

I modelli di recaptioning sono strumenti di intelligenza artificiale che prendono le immagini o i video e ne generano nuove descrizioni o titoli.

Funziona più o meno così: immagina di mostrare a un computer un’immagine di un gatto che dorme su un divano. Il modello di recaptioning guarda l’immagine e poi scrive una frase che descrive ciò che vede, tipo “un gatto che fa un pisolino sul divano”.

Questo processo aiuta i computer a capire meglio le immagini e i video, rendendoli più utili per varie applicazioni, come aiutare le persone a trovare facilmente le foto giuste cercando con parole chiave o migliorare l’accessibilità per chi ha difficoltà visive fornendo descrizioni dettagliate di contenuti visivi.

Un futuro promettente

Con la sua introduzione, Sora è destinato a diventare uno strumento prezioso per i professionisti creativi, offrendo loro nuove modalità per esprimere la propria visione artistica.

Nonostante le ricerche e i test approfonditi, è tuttavia impossibile prevedere tutte le modalità con cui questa tecnologia verrà utilizzata o abusata. È per questo che OpenAI considera il feedback dal mondo reale un componente critico nello sviluppo e nel rilascio di sistemi AI sempre più sicuri nel tempo.

Picture of Rossella Bianchi

Rossella Bianchi

Responsabile Marketing di Bludata Informatica
Condividi su

Post collegati