rotate-mobile
Cronaca

Tecnologia: il ricercatore Mirco Ravanelli premiato a New Orleans

Mirco Ravanelli, ricercatore Fbk, ha ricevuto un premio di 1.500 dollari alla più importante conferenza globale sul riconoscimento vocale

Mirco Ravanelli, ricercatore Fbk, ha ricevuto un premio di 1.500 dollari alla più importante conferenza globale sul riconoscimento vocale. Un ottimo risultato per il ricercatore trentino, considerato che sono stati oltre 2.600 i lavori proposti - e di questi 1.317 accettati - alla 42esima conferenza internazionale per la ricerca nel settore del riconoscimento vocale e del “signal processing” ICASSP 2017,​ che si è tenuta da 5 al 9 marzo a New Orleans, negli Stati Uniti.

Il trentunenne trentino è in forza al gruppo 'Shine' del Centro Ict della Fondazione Bruno Kessler di Trento: "Sono entrato in Fondazione per la compilazione della mia tesi di laurea. Ora sono all’ultimo anno del mio dottorato e questo premio rappresenta un importante riconoscimento per me. L’esperienza dello scorso anno è stata determinante. Ho trascorso sei mesi a Montréal, in Canada, nel laboratorio di Yoshua Bengio, uno dei guru del deep learning. Bengio ha un H-index di 92 e per lavorare nel suo laboratorio c’è una richiesta altissima. Pensate che lo scorso anno ha ricevuto circa 700 domande, ma ne ha accettate solo 20. Io ero tra questi". 
 
Lo studio di Ravanelli e dei colleghi premiato a New Orleans, che titola  “A network of deep neural networks for distant speech recognition" (Una rete di reti neurali per il riconoscimento vocale a distanza), sebbene sviluppato nell’ambito del riconoscimento vocale, definisce un nuovo paradigma particolarmente flessibile, che può trovare applicazione in moltissimi altri settori, tra i quali la robotica, dove diversi sistemi devono cooperare nel migliore dei modi per raggiungere un unico obiettivo comune.


Lo studio 

Costruire computer in grado di riconoscere il parlato rappresenta un passo fondamentale per lo sviluppo delle future interfacce uomo-macchina e più in generale per lo sviluppo di un’intelligenza artificiale. Per questi motivi, negli ultimi anni l’interesse verso questo tipo di tecnologie è cresciuto moltissimo, portando anche a numerose applicazioni commerciali come gli assistenti vocali di Siri di Apple, Google Voice e Alexa di Amazon.  Tuttavia, la maggior parte dei sistemi attuali fornisce prestazioni soddisfacenti solamente in ambienti a bassa rumorosità e con parlatori che interagiscono vicino ad un microfono, rendendo di grande interesse lo studio di tecnologie più robuste in grado di funzionare anche a distanza dal parlatore, in ambienti complessi caratterizzati da rumori di vario tipo e riverbero.

Il lavoro di Ravanelli propone di cambiare in maniera significativa la modalità attraverso cui questa tecnologia viene impiegata negli attuali sistemi di riconoscimento del parlato a distanza. Anche i sistemi più evoluti, infatti, sono basati sulla cascata di diverse tecnologie che vengono tipicamente sviluppate in maniera indipendente, senza nessuna garanzia circa la loro effettiva compatibilità ed il loro adeguato livello di comunicazione e cooperazione.

Gli attuali sistemi potrebbero dunque essere paragonati ad una squadra di calcio che, anche se composta da ottimi giocatori singoli, non sarà mai in grado di vincere il campionato se questi giocatori non sono in grado di giocare bene assieme. La “rete di deep neural networks” proposta nello studio rivede dunque drasticamente l’architettura degli attuali sistemi, “rompendo” questa cascata inserendo tutte le tecnologie coinvolte nel riconoscimento vocale all’interno di una rete dove c’è piena comunicazione e cooperazione fra i vari elementi.  L’attenzione della ricerca si è concentrata non solo sulla definizione di una nuova architettura, ma soprattutto sullo studio di innovative tecniche per addestrare in modo automatico questa rete di componenti. Il lavoro ha portato alla definizione di un nuovo algoritmo di addestramento (chiamato “backpropagation through network”) in cui tutti gli elementi nella rete vengono addestrati in modo congiunto e progressivamente imparano in modo automatico ad interagire, comunicare e cooperare fra loro.

Si parla di

In Evidenza

Potrebbe interessarti

Tecnologia: il ricercatore Mirco Ravanelli premiato a New Orleans

TrentoToday è in caricamento