Maestro Roberto - Tecnologie e didattica

Per iscriversi alla newsletter Maestro Roberto inviare una mail all'indirizzo info@robertosconocchini.it con oggetto Iscrizione newsletter e testo vuoto

Oltre il prompt: creare immagini grazie a Whisk di Google Labs PDF Stampa E-mail
Risorse - Intelligenza Artificiale
Scritto da Administrator   
Martedì 27 Gennaio 2026 12:06

Siamo abituati a pensare alla generazione di immagini tramite IA come a un esercizio di scrittura: ore passate a perfezionare "prompt" testuali infiniti per spiegare all'algoritmo cosa abbiamo in testa. Ma cosa succederebbe se potessimo comunicare con l'intelligenza artificiale usando direttamente il linguaggio visivo?

La risposta è Whisk, l'ultimo esperimento di Google Labs che sta cambiando radicalmente le regole del gioco creativo.

Whisk non è il classico generatore di immagini. La sua particolarità risiede nel sistema a tre livelli di controllo, che permette di "shakerare" (da qui il nome, che richiama la frusta da cucina) diverse fonti visive per ottenere un risultato unico.

Invece di scrivere descrizioni chilometriche, Whisk ti permette di caricare o selezionare tre ingredienti fondamentali:

  1. L'Oggetto (Subject): L’elemento centrale, il protagonista della tua creazione.

  2. La Scena (Scene): L'ambiente, il contesto e la composizione spaziale.

  3. Lo Stile (Style): L'estetica, il tratto artistico o l'atmosfera cromatica.

Un esempio pratico: Dal laboratorio all'Anime

Per capire la potenza di questo strumento, ho voluto fare un test combinando tre elementi apparentemente distanti tra loro, ma che insieme creano una narrazione potentissima.

  • Il Soggetto: Ho caricato una mia foto personale nel campo "Oggetto". Volevo che l'IA riconoscesse i miei tratti distintivi per rendermi protagonista.

  • La Scena: Come ambientazione, ho scelto l'immagine di un laboratorio scientifico. Whisk ha interpretato questo input non solo come sfondo, ma come il "mondo" in cui il mio avatar doveva muoversi.

  • Lo Stile: Per dare un tocco artistico e originale, ho impostato come riferimento uno stile da fumetto Anime.

Il risultato? Senza scrivere una sola parola di codice o descrizioni tecniche sulla profondità di campo o il tipo di tratteggio, Whisk ha fuso i tre elementi. Mi ha proiettato all'interno di quel laboratorio, trasformando la mia fisionomia e l'ambiente circostante in un’illustrazione coerente, con i colori saturi e le linee dinamiche tipiche dei manga giapponesi.

La vera magia di Whisk, alimentata dai modelli Gemini e Imagen, è la sua capacità di mantenere la coerenza. Se decidi di cambiare la "Scena" da un laboratorio a una foresta incantata, ma mantieni la tua foto come "Oggetto", l'IA saprà riportare il tuo volto (opportunamente stilizzato) nel nuovo contesto.

 

 

Whisk è la prova che il futuro della creatività è sempre più accessibile e meno vincolato alla capacità di scrivere prompt complessi. Basta un'idea, qualche immagine di riferimento e la voglia di sperimentare.

E tu, quale stile sceglieresti per il tuo prossimo avatar su Whisk? Se hai già provato la piattaforma o hai una combinazione folle in mente, scrivimelo nei commenti!

https://labs.google/fx/it/tools/whisk