Translatotron: el “robot” de Google que puede traducir en directo la voz a otro idioma, sin usar texto

-Gracias a la Inteligencia Artificial, este sistema permite mantener la fonética y el tono de voz de las personas.

 

El gigante Google asegura haber creado un nuevo e innovador sistema de traducción, conocido como Translatotron, en el que a través de mecanismos de Inteligencia Artificial (IA) es capaz de traducir la voz de un idioma a otro directamente, sin necesidad de realizar ninguna conversión a texto.

La unidad especializada en Inteligencia Artificial del gigante de Mountain View, California, anunció este nuevo sistema, que propone un nuevo modelo alternativo de secuencia a secuencia con el que se elimina la necesidad de representar texto intermedio en una traducción.

El funcionamiento de Translatotron se basa en un solo proceso, en lugar de dividirlo en distintas fases como sucede en los sistemas de traducción actuales, que se apoyan en mecanismos de síntesis de voz a texto.

Con este sistema, los investigadores aseguran que pueden lograr una velocidad de traducción más rápida, en la que se evitan los errores del proceso de reconocimiento de habla y traducción, “reteniendo directamente la voz original del hablante después de la traducción”.

Según detalla Google en su blog oficial, logra también alcanzar una mejor gestión gestión de las palabras que no se traducen, como los nombres propios.

 

Cómo funciona Translatotron

Google utiliza como fuente espectogramas con la señal de voz captada y genera otros línea de voz en el idioma elegido para la traducción. También emplea un codificador de voz neuronal que convierte el espectograma resultante en ondas de audio con referencias de tiempo.

Además, puede añadirse un mecanismo adicional que aprende las características del habla de una persona y que las codifica para lograr mantener su tono de voz, para utilizarlo posteriormente en la sintetización de la traducción de voz.

La Inteligencia Artificial de Google utiliza objetivos multitarea para predecir los movimientos de la fuente, al mismo tiempo que genera los espectogramas de la traducción.

 

Facebook Comments

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

%d bloggers like this: