Durante la TechFest 2012, l’appuntamento in occasione del quale vengono presentate le tecnologie grazie alle quali sarà possibile cambiare le modalità mediante cui le persone interagiscono con i computer, la divisione Microsoft Research della ben nota multinazionale ha presentato un interessante progetto per la traduzione simultanea della voce capace, appunto, di tradurre da e in ben 26 lingue differenti, tra cui anche l’italiano e il cinese mandarino, agendo direttamente in tempo reale.
Il sistema, nel dettaglio, per poter funzionare nel miglior modo possibile necessita di circa un ora di addestramento conseguenzialmente al quale è poi in grado di restituire risultati risultati straordinari rivelandosi quindi una risorsa che, sino a questo momento, poteva essere considerata soltanto fantascienza.
Il traduttore vocale simultaneo di Microsoft è infatti in grado di riconoscere l’accento, l’intonazione ed il timbro della voce e di riprodurre, in una delle tante lingue supportate, quanto pronunciato in maniera estremamente precisa.
Questo, in altri termini, sta quindi a significare che il traduttore è in grado di riconoscere la lingua di input, tradurre la frase e riprodurla con la medesima voce nella lingua di output.
Durante l’evento Frank Soong, responsabile del reparto sul riconoscimento vocale del laboratorio di Pechino, ha effettuato una dimostrazione del sistema traducendo la voce di Rick Rashid, il suo principale, in italiano, spagnolo e cinese mandarino.
Tenendo conto delle sue straordinarie caratteristiche distintive, il traduttore vocale simultaneo potrebbe quindi rivelarsi estremamente utile per i turisti che non hanno dimestichezza con la lingua parlata nel paese visitato, per lo studio di nuove lingue o, ancora, per le indicazioni stradali nelle app di navigazione da impiegare su device mobile.
Il prodotto dovrebbe e potrebbe fare la sua comparsa sul mercato entro la fine del 2013 con l’obiettivo di applicare ulteriori perfezionamenti entro tale data facendo quindi in modo che il traduttore riesca anche a riprodurre le pause e le indecisioni presenti nelle conversazioni.