Generador de voz de Amazon basado en el uso de redes neuronales es capaz de sonar como la voz de un presentador humano

By pontecool 2019-08-05 10:27:32 Tecnologia

Amazon Web Services lanzó a finales del 2016 su servicio en la nube Amazon Polly, destinado a la conversión del texto en voz. Pero este campo ha experimentado varias novedades en los últimos meses gracias al uso de redes neuronales (recordemos el WaveNet de Google, capaz de sintetizar voces que imitan aspectos como el estrés y la entonación).

De modo que Amazon ha decidido recoger el guante de Google y ponerse al día con su última actualización de Amazon Polly y hace unas horas, anunció que su nuevo conversor neuronal de texto a habla estaba por fin disponible para el público general.

Julien Simon, "evangelista" tecnológico de Amazon Web Services, afirma que el nuevo sistema de generación de voz ofrece "mejoras significativas" en la calidad de la misma, gracias a un aumento de la naturalidad y la expresividad.

Por eso, además de la voz sintética por defecto de Amazon Polly (que ya muestra una mejora frente a la original gracias al uso de las redes neuronales), la plataforma ofrece una segunda voz conocida como "Modo presentador", con realismo mejorado y destinada a la lectura de textos de prensa, que vienen usando desde hace unos meses en sus productos varias compañías (y varios dispositivos basados en Alexa).

Fuente: El nuevo generador de voz sintética de Amazon se basa en el uso de redes neuronales y es capaz de sonar como un locutor humano

Artículos Relacionados