Imagen%2C+da+testo+ad+immagine+grazie+a+Google%2C+risultati+incredibili+per+il+prototipo
androiditalycom
/2022/05/27/imagen-da-testo-ad-immagine-grazie-a-google-risultati-incredibili-per-il-prototipo/amp/
Media

Imagen, da testo ad immagine grazie a Google, risultati incredibili per il prototipo

Il nuovo progetto di Google è assurdo. Avete mai visto un software che crea delle immagini basandovi su quello che scrivete? Attenzione: non stiamo parlando di ricerca, bensì di realizzazione. Ma come dovrebbe funzionare un software del genere?

Imagen trasforma tutto ciò che scriviamo in foto – Androiditaly.com

Imagine è il nuovo progetto di Google, il quale ha visto la luce grazie ad un gruppo di ricerca che ha sostanzialmente carta bianca sui programmi da sviluppare, ma che si concentra soprattutto sul machine learning. Fra queste, infatti, vi è anche la possibilità di ottenere un’immagine dalla sua descrizione testuale. Nel suo caso è molto particolare poiché realizza letteralmente – e nella maniera più precisa possibile – quello che noi chiediamo.

Questi sistemi addestrati su dati di immagini prendono il nome inglese di “text-to-image diffusion model”, che si può tradurre semplicemente in “modello di diffusione dal testo all’immagine”. L’esempio generativo che viene utilizzato, però, è ciò che si usa per creare dati simili a quelli sul quale viene addestrato. Il più comune potrebbe essere il rumore grafico aggiunto a un’immagine a cui segue il processo inverso, in modo tale che il modello impari a recuperare l’immagine di partenza da un suono indistinguibile.

Metodo di funzionamento del sistema

Questo sistema è davvero sorprendente – Androiditaly.com

Inoltre, i ricercatori hanno avuto modo di scoprire che sia possibile avere degli ottimi risultati, come quelli di Imagen, usando modelli pre-addestrati di solo testo, e il framework di Google lo dimostra con la digitazione di “T5 text-to-text”, che deriva dalle cinque “T” nel nome “Text-To-Text Transfer Transformer”. In tal caso non esamina le parole di una frase sequenzialmente, bensì esegue solo un piccolo numero costante di passi tra le parola; a ogni passo applica un meccanismo di auto-attenzione che modella direttamente le unioni possibili tra tutte le parole in una frase, al di là della loro posizione originale.

Ora come ora, Imagen può essere usato soltanto dalla demo del sito perché, e se vi state chiedendo come mai hanno preso questa scelta, ecco la dichiarazione ufficiale di Brain Team: “Si basa su codificatori di testo addestrati su dati non curati su scala web e quindi eredita i pregiudizi sociali e i limiti dei modelli linguistici di grandi dimensioni. Di conseguenza, c’è il rischio che Imagen abbia codificato stereotipi e rappresentazioni dannose, il che spiega la nostra decisione di non rilasciare Imagen per l’uso pubblico senza ulteriori garanzie“.

Sebastiano Spinelli

Recent Posts

PlayStation censura una scena di Stellar Blade dopo tante polemiche: cosa è successo

Altro duro colpo per Stellar Blade che da qualche ora è finito di nuovo nella…

3 giorni ago

Fallout 2: la chicca sulla location che fa crescere l’attesa dei fan

Fallout, come tutti sanno, nasce come videogioco. Con l'uscita della serie tv però la saga…

3 giorni ago

Il logo di Android prende ispirazione da un vecchissimo videogioco? La storia segreta

Quanto sai della storia del logo Android? Non è necessario essere un esperto per riconoscere…

3 giorni ago

Il lavoro ideale per il tuo segno zodiacale: ci vogliono caratteristiche precise

Qual è il lavoro ideale per ogni segno zodiacale? Quello che permette alle sue caratteristiche…

3 giorni ago

Cosa fare se si perde lo Smartwatch: questa funzione può davvero salvarti

Hai perso lo smartwatch di recente? Con questa funzione potrai sentirti al sicuro: è la…

3 giorni ago

Google da oggi ti paga, puoi farlo da casa e stare comodamente sul divano: guadagno semplicissimo

Nell’era digitale di oggi, ci sono innumerevoli modi di guadagno extra e tra le opzioni…

4 giorni ago