Ford e Nuance, dialogare con l’auto sarà sempre più semplice


Nello scenario del Ford Research and Engineering Center di Aachen, Germania, Ford Motor Company e Nuance Communications, realtà di primo piano nel campo delle tecnologie di riconoscimento vocale, hanno offerto una panoramica dell’evoluzione delle tecnologie di riconoscimento vocale dalla loro prima comparsa nella storia fino ai giorni nostri, per dare uno sguardo alle tendenze future.

Già al momento del debutto di Ford SYNC all’IFA di Berlino (rimandiamo i lettori a questa notizia per maggiori approfondimenti), la casa automobilistica statunitense ha chiaramente sottolineato come il riconoscimento vocale rappresenti il modo più immediato, intuitivo e sicuro per governare molte delle funzioni di un moderno mezzo di trasporto.

Ma la visione di Ford va oltre: il concetto è infatti quello di poter usare i sistemi informatici delle vetture per integrare al suo interno i dispositivi personali (smartphone, lettore multimediale) e di utilizzare la voce come unico strumento di controllo che permetta di gestire questi dispositivi in maniera sicura ed agevole. Il comando vocale, del resto, è l’unico che consente al guidatore di evitare distrazioni e di continuare a tenere gli occhi sulla strada, a tutto vantaggio della sicurezza di guida. E’ una recente ricerca della stessa Ford che ha avuto modo di constatare, ad esempio, che un conducente di un veicolo distrae lo sguardo dalla strada in media per 25 secondi per scegliere un brano musicale utilizzando i comandi tradizionali, contro i soli 2 secondi necessari con i comandi vocali.

L’obiettivo ultimo delle tecnologie di riconoscimento vocale è quella di consentire all’utente di impartire ordini vocali con estrema naturalezza, allontanandosi, cioè, sempre di più da un contesto di comandi predeterminati da “imparare a memoria” per andare incontro ad uno scenario dove si “converserà” con l’auto esattamente come se stesse conversando con un altro individuo. La visione di Ford e Nuance è quella di realizzare sistemi che permettano di comprendere le intenzioni dell’utente anche se egli non ha pronunciato il comando esatto, con l’analisi delle parole chiave che ha utilizzato.

Si tratta di una sfida tecnologica di particolare spessore che può implicare il supporto di tecnologie di cloud computing, dove gran parte dell’analisi del comando pronunciato dall’utente avviene in centri di calcolo remoti, come accade con il sistema di riconoscimento vocale Siri che Apple ha introdotto lo scorso anno in iPhone 4S. Demandare il lavoro di elaborazione ed analisi ad un data center remoto, altrimenti impossibile per la potenza elaborativa dei processori presenti sui sistemi informativi automotive, consentirà un maggior livello di riconoscimento dei comandi, oltre alla possibilità di impartire istruzioni sempre più articolate che consentiranno di riflesso di fruire di servizi più avanzati.

Il sistema di infotainment SYNC di Ford è già presente su più di 4 milioni di veicoli negli USA, e nel corso dell’anno sarà disponibile in Europa a bordo di B-MAX, Focus, C-MAX, Transit e Fiesta. Al momento del lancio SYNC sarà in grado di comprendere e comunicare in inglese, francese, spagnolo, portoghese, tedesco, italiano, turco, olandese e russo. L’obiettivo di Ford è di commercializzare entro il 2015 13 milioni di veicoli in tutto il mondo dotati di SYNC, di cui 3,5 milioni in Europa.

E’ necessario risalire fino al 1939, alla Fiera Mondiale di New York per incontrare il primo dispositivo nella storia in grado di parlare con voce umana grazie a tecnologie di sintesi vocale. Allora un complesso sistema di pedali e pulsanti consentiva al dispositivo di comunicare.

E’ solo nel 1976 però che viene sviluppato il primo sistema capace di riconoscere e decodificare la voce. Il merito è di Jim Baker, ingegnere IBM, che crea un dispositivo con un vocabolario di 1000 parole e che rappresenta l’antenato dei moderni sistemi di riconoscimento vocale.