QUESTA GIOCONDA ANIMATA è STATA CREATA DA AI, ED è TERRIFICANTE

Send

Il sorriso enigmatico e dipinto della "Gioconda" è conosciuto in tutto il mondo, ma quel famoso volto ha recentemente mostrato una nuova sorprendente gamma di espressioni, per gentile concessione dell'intelligenza artificiale (AI).

In un video condiviso su YouTube il 21 maggio, tre videoclip mostrano esempi sconcertanti della Gioconda mentre muove le labbra e gira la testa. È stata creata da una rete neurale convoluzionale, un tipo di IA che elabora le informazioni proprio come fa un cervello umano, per analizzare ed elaborare le immagini.

I ricercatori hanno addestrato l'algoritmo per comprendere le forme generali delle caratteristiche del viso e il modo in cui si comportano l'una rispetto all'altra, e quindi applicare tali informazioni alle immagini fisse. Il risultato è stato una sequenza video realistica di nuove espressioni facciali da un singolo fotogramma.

Per i video di Mona Lisa, l'IA ha "imparato" il movimento del viso da set di dati di tre soggetti umani, producendo tre animazioni molto diverse. Mentre ciascuna delle tre clip era ancora riconoscibile come la Gioconda, le variazioni nell'aspetto e nel comportamento dei modelli di addestramento conferivano "personalità" distinte ai "ritratti viventi", Egor Zakharov, un ingegnere dello Skolkovo Institute of Science and Technology, e il Samsung AI Center (entrambi situati a Mosca), spiegato nel video.

Zakharov e i suoi colleghi hanno anche generato animazioni da foto di icone culturali del 20 ° secolo come Albert Einstein, Marilyn Monroe e Salvador Dali. I ricercatori hanno descritto i loro risultati, che non sono stati sottoposti a revisione paritaria, in uno studio pubblicato online il 20 maggio sulla rivista di prestampa arXiv.

I volti familiari assumono espressioni sconosciute. (Credito immagine: E. Zakharov et al.)

Produrre video originali come questi, noti come deepfakes, non è facile. Le teste umane sono geometricamente complesse e altamente dinamiche; I modelli 3D di teste hanno "decine di milioni di parametri", hanno scritto gli autori dello studio.

Inoltre, il sistema di visione umana è molto bravo a identificare "anche piccoli errori" nelle teste umane modellate in 3D, secondo lo studio. Vedere qualcosa che sembra quasi umano - ma non del tutto - innesca una sensazione di profondo disagio noto come effetto misterioso valle.

L'intelligenza artificiale ha precedentemente dimostrato che è possibile produrre deepfake convincenti, ma ha richiesto angolazioni multiple del soggetto desiderato. Per il nuovo studio, gli ingegneri hanno introdotto l'IA in un set di dati molto ampio di video di riferimento che mostrano volti umani in azione. Gli scienziati hanno stabilito punti di riferimento facciali che si applicano a qualsiasi volto, per insegnare alla rete neurale come si comportano i volti in generale.

Quindi, hanno addestrato l'intelligenza artificiale a utilizzare le espressioni di riferimento per mappare il movimento delle funzionalità della sorgente. Ciò ha permesso all'intelligenza artificiale di creare un deepfake anche quando aveva solo un'immagine su cui lavorare, hanno riferito i ricercatori.

E più immagini sorgente hanno prodotto un risultato ancora più dettagliato nell'animazione finale. I video creati da 32 immagini, anziché solo una, hanno raggiunto il "realismo perfetto" in uno studio condotto dagli utenti, hanno scritto gli scienziati.

Send