The new AI can “imagine” an object never seen before

Photo by the author
by Gianluca Riccio

Technology

The new AI can “imagine” an object never seen before

Riuscite a immaginare un gatto grigio? Bene. Ora, immaginatelo con il pelo bianco. Ora, immaginatelo camminare sulla Grande Muraglia cinese. Fatto? Ecco, in questi istanti una rapida serie di attivazioni neuronali nel vostro cervello ha prodotto variazioni dell’immagine presentata, in base alla vostra precedente conoscenza del mondo.

Facile immaginare, per noi esseri umani. Per un’intelligenza artificiale è tutta un’altra storia, invece. Nonostante i progressi nelle reti neurali, che eguagliano o superano le prestazioni umane in determinate attività, i computer sono ancora lontani dall’abilità umana di immaginare delle cose.

Imagine? Impossible for an AI. At least until yesterday.

Ora, un team di ricerca della USC ha sviluppato un’intelligenza artificiale che utilizza capacità simili a quelle umane per immaginare un oggetto mai visto prima con attributi diversi. Il documento, intitolato “Zero-Shot Synthesis with Group-Supervised Learning”, was released in May, and collateral research has flourished ever since.

“Siamo stati ispirati dalle capacità di generalizzazione visiva umana per cercare di simulare l’immaginazione umana nelle macchine”, dice l’autore principale dello studio Yunhao Ge. “Gli esseri umani possono separare le loro conoscenze apprese per attributi, ad esempio forma, posa, posizione, colore, e poi ricombinarle per immaginare un nuovo oggetto. Il nostro articolo tenta di simulare questo processo utilizzando le reti neurali”.

to imagine
Yunao Ge

Il problema della generalizzazione dell’intelligenza artificiale

Supponiamo di voler creare un sistema di intelligenza artificiale che generi immagini di automobili. All’inizio forniamo all’algoritmo alcune immagini di un’automobile. Il compito sarebbe di generare molti tipi di auto, in qualsiasi colore, da più angolazioni. This is a serious challenge: create neural networks capable of extracting the underlying rules and applying them to a wide range of new examples never seen before. But networks today are trained on sample characteristics, without taking into account the attributes of an object.

In this new study, the researchers attempted to overcome this limitation.

The secret? It's called untangling

to imagine
Gli sviluppi dell’intelligenza artificiale capace di costruire cose mai viste prima, sulla base di conoscenze acquisite.

Il lavoro del team di ricerca si è basato sull’applicazione di un metodo chiamato districamento. Il districamento può essere utilizzato per generare deepfake, ad esempio, sintetizzando nuove immagini e video che sostituiscono l’identità di una persona con un’altra persona, ma mantenendo il movimento originale.

Il nuovo approccio prende un gruppo di immagini campione, non un campione alla volta come gli algoritmi tradizionali. Dd estrae la somiglianza tra di loro per ottenere qualcosa chiamato “apprendimento di rappresentazione districato controllabile”.

Quindi, ricombina questa conoscenza per ottenere una “nuova sintesi controllabile di immagini”. Potremmo usare il verbo “immaginare”.

It's a very similar process to how we humans extrapolate: when a human sees the color of an object, we can easily apply it to any other object by replacing the original color with the new one. Using the untangling technique, the team generated a new dataset containing 1,56 million images that could aid future research in the field.

Imagining helps to understand the world

Sebbene il districamento non sia un’idea nuova, i ricercatori affermano che la loro struttura può essere compatibile con quasi tutti i tipi di dati o conoscenze. Questo amplia le opportunità per le applicazioni.

Nel campo della medicina, ad esempio, il districamento potrebbe aiutare medici e biologi a scoprire farmaci più utili separando la funzione medica da altre proprietà e quindi ricombinandole per sintetizzare nuova medicina. Riuscire a far “immaginare” le macchine potrebbe anche aiutare a creare un’intelligenza artificiale più sicura. Ad esempio consentendo ai veicoli autonomi di immaginare ed evitare scenari pericolosi mai visti prima durante l’addestramento.

“Il deep learning ha già dimostrato prestazioni e promesse insuperabili in molti campi. Troppo spesso, però, ciò è avvenuto attraverso un mimetismo superficiale e senza una comprensione più profonda degli attributi separati che rendono ogni oggetto unico”, ha affermato Laurent Itti, professore di informatica . “Questo nuovo approccio di districamento, per la prima volta, scatena davvero un nuovo senso di immaginazione nei sistemi di intelligenza artificiale, avvicinandoli alla comprensione umana del mondo”.