giovedì 15 marzo 2012

Ecco il traduttore vocale di Microsoft: parlerà 26 lingue, italiano compreso

Si chiama Monolingual Tts, appartiene alla categoria dei software e la sua peculiarità è quella di attivare traduzioni multilingua istantanee interpretando la voce umana ed imitandone il suono in fase di output. A dirla tutta,i tempi di risposta del sistema non sono al momento in tempo reale - occorre circa un'ora di tempo affinché l'attuale versione sperimentale dell'applicazione sia in grado di riconoscere le espressioni della voce dell'utente – ma sulla bontà di questa innovazione non si discute. Una volta perfezionato, Monolingual Tts gestirà infatti la registrazione e la riproduzione vocale in 26 lingue diverse, italiano compreso.
Altra dote all'avanguardia del software, presentato qualche giorni fa nel corso del TechFest2012 dai responsabili di Microsoft Research Asia (laboratorio di ricerca con sede a Pechino), è quindi la presenza di un programma in grado di elaborare a video la faccia dell'interlocutore, con una immagine 3D della testa e animando le labbra a ritmo delle parole da questi pronunciate. Il tutto combinando tecnologie di sintetizzazione vocale "tex-to-speech" per convertire il testo in parlato con una voce simile a quella reale e di animazione video in tre dimensioni.

Allo stato attuale siamo ancora nel campo dei test e lontani dalla disponibilità commerciale del software ma le prime "demo" pubbliche del sistema – realizzate ricorrendo a uno speciale avatar virtuale capace di comunicare con una mimica ed una espressione fedele al volto originale in due lingue, inglese e cinese - ne hanno fatto intuire le enormi potenzialità. Soprattutto in ambiti quali il turismo o il mondo dell'education.
Il principio alla base di Monolingual è in ogni caso il medesimo: dare luogo a un'interlocuzione diretta (da vicino o da remoto) e decisamente più veloce fra due o più soggetti senza che nessuno di questi conosca la lingua dell'altro. Il passo successivo a cui Microsoft starebbe già lavorando è l'integrazione di questa tecnologia a bordo degli smartphone, con l'intento di abilitare l'utente a traduzioni istantanee di testi scritti, insegne o cartelli stradali in lingua straniera importati nella memoria del dispositivo attraverso la fotocamera digitale.
L'ulteriore frontiera, a detta di alcuni il vero sogno nel cassetto dei ricercatori del colosso di Redmond, è però quella di poter permettere a una persona seduta comodamente nel suo ufficio di conversare con un collega straniero parlando nella lingua di quest'ultimo per bocca di un avatar, modellato a propria immagine e somiglianza e in grado di tradurre simultaneamente il parlato tramite apposito computer.

Nessun commento:

Posta un commento