Amazon, Panos Panay presenta Alexa+: “Maggiore umanità e un tocco italiano”
Leggi in app
LONDRA – Quando Panos Panay discute di Alexa, il suo volto si illumina. Il responsabile dei dispositivi e dei servizi di Amazon, giunto a Seattle dopo una lunga carriera in Microsoft, si occupa di Alexa da almeno due anni. È diventata parte integrante della sua vita. E non si tratta di una semplice espressione figurativa.
Da quando ha ricevuto un aggiornamento significativo, potenziato dall’intelligenza artificiale generativa, Alexa è capace di intrattenere conversazioni utilizzando un linguaggio naturale. Durante la cena, per Panay, è come avere un ulteriore commensale a tavola. Solo che, nell’era dell’IA, invece di una sedia, si aggiunge una voce sintetica, femminile, che non si limita più a gestire luci, riprodurre musica o impostare timer. Interviene, come se fosse un ospite reale. È come se le abilità del noto assistente di Amazon, creato dodici anni fa per facilitare la comunicazione con la tecnologia domestica, si fossero improvvisamente ampliate.
Il merito va alle nuove funzionalità di Alexa+, dove il “+” indica “più intelligente”. Non che in precedenza non fosse già intelligente. In passato, era in grado di comprendere comandi vocali complessi, riconoscere il contesto e gestire un vasto ecosistema di servizi e dispositivi connessi. Ma ora, grazie alle reti neurali che simulano il funzionamento del cervello umano – le stesse utilizzate da chatbot come Claude, Gemini o ChatGpt – Alexa può rispondere come farebbe una persona reale.
Panos Panay ha avuto l’opportunità di testare queste nuove capacità prima di altri. E le descrive con dettagli minuziosi, tipici di recensioni entusiastiche. “È successo anche ieri sera: durante una conversazione, può capitare di non ricordare un particolare o di voler verificare un’informazione”, racconta Panay in una sala riunioni del Principal Place, un edificio di quindici piani a Londra, nel quartiere di Shoreditch, dove si trovano gli uffici di Amazon. “A quel punto, basta chiedere ad Alexa. Non è necessario prendere il telefono, aprire un’app o accendere uno schermo pieno di altre distrazioni. Chiedi e ricevi la risposta. La sua conoscenza è vasta e accurata”.
Panos Panay, Senior Vice President at Amazon Devices and Services
Non è strano considerare Alexa come un ulteriore commensale a tavola?
“In realtà, non lo è affatto. È proprio il concetto che utilizziamo internamente nel team: invitare Alexa al tavolo da pranzo. Comprendo che ci sia una certa sensibilità riguardo alla privacy, ma noi progettiamo ogni funzione partendo dai principi fondamentali della sicurezza. Non ho esitazioni a dirlo, anzi. A volte, persino mia moglie, Anastasia, mi dice: “Non coinvolgere Alexa in questo”. Proprio come farebbe con una persona reale. Credo sia una dinamica estremamente autentica e penso che diventerà sempre più comune. Il potere dell’ambient computing risiede proprio in questo: nella naturalezza con cui chiedi aiuto e trasformi l’esperienza quotidiana”.
Ma in termini pratici, come si traduce questa “presenza” nella gestione della vita familiare?
“Un aspetto cruciale è il calendario familiare. Tutti noi aggiungiamo eventi semplicemente esprimendo vocalmente i nostri pensieri. Alexa poi ci avvisa riguardo ai prossimi impegni o invia notifiche a tutti i membri della famiglia. Osservare come Alexa+ analizzi i dati per semplificare la gestione familiare dimostra quanto profondamente stia cambiando le nostre vite”.
Come avete creato il “cervello italiano” di Alexa+? Avete adottato misure specifiche per il nostro Paese?
“Certamente, ed è per questo che ci stiamo prendendo il tempo necessario per perfezionarla per l’Italia; è stata un’impresa notevole. Ci siamo concentrati sugli aspetti culturali, che sono fondamentali. Il team sta lavorando meticolosamente perché si tratta di cogliere sfumature sottili. Se le chiedessi del Festival di Sanremo, lei saprebbe esattamente cosa rappresenta e quanto sia centrale per la cultura italiana, e interagirebbe in modo pertinente. Allo stesso modo, se dicessi di voler mettere il ketchup sulla pasta – o l’ananas sulla pizza – reagirebbe con il giusto “fastidio” ironico, dimostrando di conoscere i vostri canoni culinari. Anche l’accento e i dialetti sono stati calibrati con attenzione affinché, interagendo con il prodotto, l’utente percepisca di avere di fronte un’entità che si comporta in modo autenticamente italiano, rispettando le radici culturali”.
L’Italia è uno dei Paesi più “umani” al mondo. Gli italiani amano conversare costantemente tra loro, affacciati a un balcone, sull’uscio di una casa o ai tavoli dei caffè. Non era semplice convincerli a dialogare con una macchina, eppure Amazon c’è riuscita. Dal 2018, anno del lancio in Italia, Alexa ha registrato 40 miliardi di interazioni nel nostro Paese. Ritiene che questo vi dia un vantaggio competitivo, visto il senso di familiarità che gli utenti hanno sviluppato con la vostra IA?
“Credo di sì, soprattutto per quanto riguarda il fattore fiducia. La fiducia è un valore difficile da conquistare e ci sono voluti anni di lavoro. Lo dico con umiltà, ma penso che questo ci garantisca un vantaggio. Abbiamo perfezionato il sistema per rispettare la natura del parlato: in Italia esistono oltre trenta dialetti e non ci si può limitare a una traduzione automatica. Il nostro team locale e quello europeo stanno rifinendo il modello per ogni nazione. Quando lei definisce l’Italia il Paese più umano, si riferisce implicitamente alle emozioni. Il prodotto deve riflettere questa emotività. Negli ultimi otto anni abbiamo appreso moltissimo dai clienti italiani e ora, con Alexa+, offriamo conversazioni illimitate e un’utilità superiore, ma con l’approccio di un partner di cui le persone si fidano”.
L’Italia è anche il Paese delle piccole botteghe e dei ristoranti, dove il contatto umano è centrale. Cosa può offrire l’intelligenza artificiale di Alexa Plus a queste realtà, preservando al contempo le relazioni personali?
“Stiamo introducendo diversi servizi legati al cibo e allo stile di vita. Ci stiamo concentrando molto sull’integrazione con la casa intelligente, collaborando con marchi storici come Lavazza e BTicino. Il prodotto è sintonizzato sul mercato locale più di quanto si possa immaginare. Pensiamo anche alla collaborazione con Giallo Zafferano, che è un punto di riferimento enorme. Con Alexa+, l’IA comprende il contesto specifico: se chiedi “un caffè” e hai una macchina Lavazza connessa, lei sa che intendi un espresso, perché per un italiano il caffè è quello. Sono queste sfumature, nate dalla passione del nostro team locale, a rendere l’esperienza “molto italiana”. Rispettare la cultura per cui il prodotto è stato creato è la nostra missione”.
Immagino che Alexa+ non rimarrà confinata ai dispositivi Echo, ma seguirà le persone anche fuori casa, sugli smartphone o magari su occhiali smart. Alexa potrebbe contribuire al futuro immaginato nel film Her? Oggi chi usa ChatGPT o Gemini tende prevalentemente a scrivere, mentre sono ancora pochi quelli che interagiscono vocalmente. Pensate di sfidare la concorrenza puntando proprio sulla voce?
“Assolutamente sì. Questo è il vero potere dell’ambient computing. Alexa è al tuo fianco non perché hai dovuto sbloccare un telefono o aprire un’app, ma perché è presente nell’ambiente. Questa filosofia si estende ovviamente fuori casa: l’app ti segue e presto vedremo nuovi dispositivi portatili, oltre all’integrazione sempre più profonda nelle automobili. I punti di contatto che uniscono la casa, l’auto e il resto della giornata sono chiarissimi e la voce li rende estremamente potenti. Tuttavia, resterà sempre la possibilità di interagire tramite testo per i momenti in cui si preferisce la riservatezza o un approfondimento diverso”.
Riguardo alla capacità di rispondere a tutto: prima Alexa consultava dizionari o enciclopedie, ora risponde direttamente grazie all’IA. Non la preoccupa il rischio di “allucinazioni”?
“No, perché abbiamo investito moltissimo nell’architettura del sistema. La nostra piattaforma utilizza un processo di orchestrazione al vertice: quando l’utente pone una domanda, un primo modello determina quale sia il modo migliore per rispondere. Possiamo coinvolgere oltre settanta modelli diversi all’interno di AWS Bedrock, scegliendo quello più adatto al compito specifico. Le risposte vengono poi qualificate e verificate secondo parametri di fiducia molto elevati, il tutto in meno di mezzo secondo. Non siamo legati a un singolo modello e questo ci permette di essere estremamente precisi”.
Tuttavia, con così tanti passaggi simultanei, la velocità della risposta non rischia di risentirne?
“Naturalmente può capitare un errore, magari su dati in tempo reale come il risultato di una partita appena conclusa se il sistema non ha ancora recepito l’aggiornamento, ma l’accuratezza rimane la nostra priorità. La sfida costante è proprio l’equilibrio tra velocità e precisione: se scrivi su uno smartphone sei disposto ad aspettare qualche secondo prima di visualizzare il testo, ma in una conversazione vocale una pausa di quattro secondi risulterebbe del tutto innaturale. Per richieste complesse, come cercare una foto specifica tra migliaia, il sistema può prendersi un istante in più, ma per le informazioni quotidiane la risposta deve essere immediata”.
Alexa è molto apprezzata dai bambini: le chiedono barzellette o dove si trovi Babbo Natale. Ma finora l’interazione è stata limitata. Con l’IA generativa, capace di produrre risposte articolate e non prevedibili, i rischi per i minori potrebbero aumentare. Come avete affrontato la questione della sicurezza?
“Proteggere i bambini è un valore fondamentale per noi. Abbiamo una lunga esperienza nell’IA e i test sulla privacy e sulla sicurezza dimostrano che Alexa offre standard elevatissimi in questo ambito. Disponiamo di un prodotto specifico, Kids Plus, pensato per permettere ai bambini di imparare in un ambiente protetto dai “binari” della sicurezza. Il design del sistema varia in base all’età dell’utente. Abbiamo in serbo anche molte novità “magiche”: ad esempio, la possibilità per i bambini di creare le proprie storie con immagini bellissime e, in futuro, persino di pubblicare dei piccoli libri. È fondamentale mantenere dei limiti rigidi e lo stiamo facendo con estrema attenzione”.
Pensa che possa esistere una relazione sana tra macchine e adolescenti? La responsabilità è dei genitori o delle aziende tecnologiche?
“Credo appartenga a entrambi. Noi progettiamo con un profondo senso di responsabilità, ma è altrettanto importante che i genitori configurino i profili in base all’età corretta dei figli. In ogni caso, applichiamo restrizioni molto severe a prescindere dalle informazioni in nostro possesso, proprio per garantire la massima tutela”.
Come avete definito la personalità della nuova Alexa? Le sue risposte riescono a essere neutrali?
“Alexa ha una storia di molti anni, il che ci dà un grande vantaggio nella definizione della sua identità. In Italia il marchio è fortissimo e amato, quindi dobbiamo evitare che sia solo il modello linguistico a dettare la personalità. La indirizziamo affinché emerga il suo carattere: vogliamo che sia brillante, che abbia senso dell’umorismo e, per il vostro mercato, quel tocco di stile italiano. La sua intelligenza cresce con l’uso: parte della personalità consiste nel capire chi è l’interlocutore. Più vi conoscete, più la conversazione si evolve naturalmente”.
Alexa+ avrà una memoria?
“Sì, ma l’utente manterrà sempre il controllo totale e potrà eliminare qualsiasi dato in ogni momento. La memoria è fondamentale per migliorare l’esperienza. Le faccio un esempio banale ma significativo: ogni sera imposto la sveglia per le sei o per le quattro, a seconda degli impegni. È un piccolo dettaglio, come la giusta quantità di prezzemolo sulle patatine fritte che rende il piatto perfetto. Quando dico “Alexa, imposta la sveglia per le 6:00”, lei ora risponde: “Ok, ho capito. Sveglia impostata. Dormi bene, Panos”. Sentire che ti riconosce, che capisce il momento della giornata e ti rivolge un pensiero personalizzato, crea una sensazione piacevole di vicinanza”.
Il fatto che sappia molto di noi implica la gestione di una grande mole di dati. In che modo garantite la sicurezza in un’epoca in cui le persone condividono informazioni sempre più intime con i chatbot?
“Le conversazioni vocali sono archiviate in modo sicuro sui nostri server e sono accessibili esclusivamente all’utente. Rispettiamo rigorosamente ogni normativa e regolamentazione vigente; abbiamo dieci anni di esperienza nella protezione dei dati. La privacy è la nostra priorità assoluta, ma credo che l’elemento chiave sia la libertà di scelta del cliente. Se desideri che una conversazione venga cancellata, puoi farlo istantaneamente. È un approccio basato sulla trasparenza che serve a consolidare un rapporto di fiducia reale”.
Molte aziende presentano i propri servizi come “compagni IA”, a volte dotandoli di volti digitali o espressioni umane. State valutando versioni più espressive di Alexa+, magari per i dispositivi Echo Show che hanno il display integrato?
“Sì, anche se è una questione complessa. Spesso un avatar troppo presente finisce per stancare l’utente, che cerca soprattutto utilità e informazioni. Tuttavia, per alcuni la connessione emotiva è importante. La nostra gestione dell’espressività non è mai impositiva. Utilizziamo quelli che chiamiamo “Alexa-cons”: sono dei segnali visivi sulla barra luminosa che comunicano emozioni in modo sottile. Se Alexa è felice o percepisce la tua felicità, mostra un segnale che richiama un sorriso, ma rimane un dettaglio non invasivo. Se c’è qualcosa da festeggiare, potrebbero apparire dei piccoli fuochi d’artificio digitali. L’obiettivo del design è la sottigliezza: non vogliamo un personaggio che prenda il sopravvento, ma un’entità che sappia mostrare empatia senza disturbare. Quando ricevi un “Alexa-con” appropriato, senti che si è creato un momento di intesa piacevole”.
Cosa le suggerisce il fenomeno OpenClaw – l’assistente IA open-source diventato popolare negli ultimi mesi – riguardo a ciò che gli utenti desiderano davvero da un assistente IA e da Alexa+?
“Penso che il confronto tra Alexa Plus e le altre realtà dimostri che le persone desiderano un assistente capace di fare tutto. Per ottenere questo livello di servizio, bisogna essere disposti a delegare i compiti. Sono convinto che gli assistenti digitali possano fare la differenza, sollevandoci da molte incomben
I commenti sono chiusi.