
Per qualche anno sembrava la prossima grande cosa. Si riempivano gli articoli di consigli su come ottimizzare un sito per la ricerca vocale, come farsi trovare quando qualcuno chiedeva qualcosa ad alta voce all'assistente, come intercettare le domande dette invece che digitate. La ricerca vocale era data per il futuro inevitabile del modo in cui avremmo cercato le cose online. Poi, silenziosamente, ha smesso di essere un argomento a sé.
Non perché fosse un'idea sbagliata, ma perché era un'idea incompleta. La voce non è sparita: parlare ai dispositivi è diventato normale, la usiamo per i timer, per la musica, per chiedere che tempo fa. Quello che è cambiato è cosa c'è dall'altra parte quando parliamo. E lì si gioca tutta la differenza tra la ricerca vocale di ieri e l'interazione conversazionale di oggi.
Cosa prometteva la ricerca vocale
L'idea di partenza era semplice e ragionevole. Le persone, quando parlano, usano frasi diverse rispetto a quando scrivono: più lunghe, più naturali, spesso in forma di domanda. Chi digitava cercava scarpe running uomo offerta, chi parlava chiedeva quali sono le migliori scarpe da corsa per chi inizia. Da questa osservazione nacque una piccola disciplina della SEO dedicata alla voce: puntare sulle parole chiave a coda lunga, scrivere in linguaggio naturale, presidiare le domande dirette, curare le informazioni locali per le ricerche del tipo vicino a me.
Erano consigli giusti, e in larga parte lo sono ancora. Il problema è che presupponevano una cosa che oggi non è più vera: che dietro la voce ci fosse comunque un motore di ricerca classico, che restituiva una lista di link da leggere o leggere ad alta voce. La voce era solo un modo diverso di interrogare lo stesso sistema. Era un'interfaccia nuova su un motore vecchio.
Cosa è successo davvero: la conversazione ha mangiato la ricerca
La trasformazione vera non è arrivata dalla voce, è arrivata da cosa risponde. Nel giro di pochissimo tempo gli assistenti hanno smesso di essere semplici esecutori di comandi e hanno cominciato a conversare. Dentro Siri, dentro l'assistente di Google, dentro Alexa sono entrati i grandi modelli linguistici, gli stessi che muovono ChatGPT, Gemini, Claude. E con loro è cambiata la natura dello scambio.
Un assistente basato su un modello linguistico non si limita a cercare: capisce il contesto, tiene il filo del discorso, gestisce le domande di seguito. Non chiedi una cosa e ricevi dieci link, fai una domanda, ottieni una risposta, poi un'altra domanda che si appoggia alla precedente, e così via, come in una conversazione vera. ChatGPT ha una modalità vocale che permette di parlare a ruota libera, Gemini ha la sua interazione dal vivo, gli assistenti del telefono si stanno riempiendo della stessa intelligenza. La ricerca a singolo colpo, una domanda e una pagina di risultati, sta lasciando il posto a un dialogo continuo.
È qui che la vecchia ricerca vocale si dissolve: non perché abbia fallito, ma perché è stata assorbita da qualcosa di più grande. Ottimizzare per come si dice una frase a voce non ha più molto senso quando la domanda detta a voce e la domanda scritta finiscono nello stesso posto, dentro un modello che genera una risposta invece di restituire un elenco.
Dalla ricerca alla risposta: cosa cambia per chi pubblica
Questo passaggio, dalla lista di link alla risposta unica, è il vero terremoto, e riguarda chiunque pubblichi contenuti o venda online. Per vent'anni la regola è stata una sola: posizionarsi in alto nei risultati di Google. Si lavorava per stare tra i primi link, perché lì arrivava il traffico. Oggi quel meccanismo si sta incrinando.
Quando un modello risponde a voce o per iscritto, l'utente spesso non clicca più nulla: ottiene quello che cerca dentro la risposta e si ferma lì. Le stime parlano di una larghissima quota di ricerche che si conclude senza alcun clic verso un sito esterno. Google stesso, con i suoi riepiloghi generati dall'intelligenza artificiale in cima alla pagina, mostra la risposta prima ancora dei risultati, e questi riepiloghi compaiono ormai su una porzione molto consistente delle ricerche. Diversi studi indipendenti misurano un calo netto dei clic sui primi risultati quando in cima c'è una risposta generata, e previsioni di settore stimano una contrazione importante del traffico organico tradizionale nei prossimi anni.
La conseguenza è netta: non basta più essere tra i link, bisogna essere dentro la risposta. Se il modello, quando qualcuno chiede consiglio su un prodotto o su un tema, cita la tua fonte, ti nomina, ti include nel suo ragionamento, allora esisti. Se non lo fa, sei invisibile, per quanto tu sia posizionato bene nei risultati classici.
GEO e AEO: ottimizzare per le risposte, non per i link
Attorno a questo spostamento è nata una nuova disciplina, che ha già due nomi quasi sinonimi: GEO, generative engine optimization, e AEO, answer engine optimization. L'obiettivo non è più scalare la classifica dei link, ma diventare una fonte che i modelli scelgono di citare quando costruiscono le loro risposte.
Cambia anche la metrica con cui si misura il successo. Si comincia a parlare di share of model, la quota di volte in cui un brand viene menzionato nelle risposte generate, accanto o al posto del vecchio share of search. Non conta più solo quanto sei visibile nei risultati, conta quanto sei presente nel ragionamento dell'intelligenza artificiale. Ed è un terreno mobile: le fonti che i modelli citano cambiano spesso, anche di mese in mese, e la sovrapposizione tra i link che premia Google e le fonti che scelgono gli assistenti AI si è molto ridotta. Sono due mondi che si stanno separando.
Cosa significa in pratica per chi produce contenuti? Significa scrivere in modo che un modello possa capire, estrarre e citare facilmente: rispondere alle domande in modo chiaro e diretto, strutturare bene i testi, dichiarare i dati con precisione, marcare le pagine con i dati strutturati che aiutano le macchine a leggerle. Significa costruire autorevolezza vera su un tema, perché i modelli, come le persone, tendono a fidarsi delle fonti riconosciute. E significa accettare che il linguaggio naturale, lo stesso che la ricerca vocale aveva intuito, oggi serve non per farsi trovare a voce, ma per farsi capire da un'intelligenza che risponde al posto nostro.
Il ponte con il commercio: quando l'AI sceglie i prodotti
Per chi vende online tutto questo non è teoria. La stessa logica che vale per i contenuti vale, e varrà sempre di più, per i prodotti. Le piattaforme di commercio si stanno attrezzando perché i cataloghi siano leggibili e raccomandabili dagli assistenti conversazionali: quando un utente chiede a un'AI consigliami un paio di stivali da pioggia sotto i cento euro, è il modello a comporre la risposta, scegliendo prodotti da mostrare. Shopify, per esempio, sta spingendo i cataloghi dei suoi merchant dentro gli assistenti e i motori conversazionali, e sta contribuendo agli standard aperti che permettono all'intelligenza artificiale non solo di consigliare, ma di portare a termine l'acquisto.
È la naturale evoluzione del discorso: prima la ricerca diventa conversazione, poi la conversazione diventa transazione. Essere presenti nella risposta, oggi un tema di contenuti, domani sarà un tema di vendite. Per approfondire dove sta andando la vendita su ogni superficie abbiamo scritto una guida dedicata al passaggio dal multichannel al commercio ovunque.
Domande frequenti
La ricerca vocale è morta?
No, ma non è più una disciplina a sé. Parlare ai dispositivi è ormai normale, solo che la voce non interroga più un motore di ricerca classico: interroga un assistente conversazionale basato su un modello linguistico. I consigli nati per la voce, linguaggio naturale e domande dirette, restano validi, ma dentro una logica più ampia di ottimizzazione per le risposte generate.
Cosa sono GEO e AEO?
Sono i nomi della nuova ottimizzazione: GEO sta per generative engine optimization, AEO per answer engine optimization. Indicano il lavoro di rendere i propri contenuti facili da capire, estrarre e citare per i modelli di intelligenza artificiale, in modo da comparire nelle risposte che gli assistenti generano, non solo nei link dei motori di ricerca.
Conviene ancora fare SEO classica?
Sì, ma non basta più da sola. La SEO tradizionale resta utile, perché molti modelli si appoggiano comunque ai contenuti ben indicizzati per costruire le risposte. La differenza è che oggi il fine non è solo il clic sul link, ma la presenza nella risposta. Le due cose convivono: contenuti solidi e autorevoli lavorano su entrambi i fronti.
La voce era solo l'inizio
La ricerca vocale non ha fallito, ha semplicemente anticipato una parte della storia. Aveva capito che avremmo parlato alle macchine in modo naturale, ma immaginava ancora un motore che restituiva link. Quello che è arrivato dopo è più radicale: macchine che capiscono, ricordano, rispondono e, presto, agiscono per noi.
Per chi pubblica e per chi vende, la lezione è chiara. Non si tratta più di farsi trovare, si tratta di farsi scegliere da un'intelligenza che parla al posto del cliente. Significa contenuti pensati per essere capiti e citati, dati ordinati, autorevolezza costruita nel tempo. La voce era solo l'inizio: il presente è la conversazione, e il futuro prossimo è un assistente che, dopo aver risposto, completa anche l'acquisto. Conviene farsi trovare pronti adesso, mentre le regole si stanno ancora scrivendo.
