Vicomtech suma realismo al podcast XRey mediante tecnología de clonación de voz basada en Inteligencia Artificial
Este ejemplo de clonación de voz constituye un gran reto científico-tecnológico que Vicomtech ha resuelto mediante tecnologías de inteligencia artificial aplicadas al procesamiento del habla. XRey es un podcast exclusivo de Spotify producido por The Story Lab que repasa las luces y las sombras sobre la figura del rey emérito. Se ha generado la voz clonada de Franco exclusivamente para dos momentos clave del guión y el bonus track, en el que se explica cómo ha sido su proceso de creación.
03.06.2020
Vicomtech ha avanzado un paso más en la aplicación de tecnologías de Inteligencia Artificial desarrollando un modelo de síntesis de habla que consigue clonar con un alto nivel de precisión la voz del Dictador Franco.
El objetivo de este desarrollo se ha centrado exclusivamente en dar respuesta a través de la tecnología a un requisito del guion de XRey que consistía en reproducir la voz de Franco en el capítulo 4, en el que lee una carta que él mismo escribió a Don Juan proponiendo a su hijo Juan Carlos como sucesor en la jefatura del Estado, además de otra intervención en el capítulo 5.
El reto tecnológico de este desarrollo basado en Inteligencia Artificial consiste en aplicar la clonación de una voz particular a una técnica narrativa innovadora y con multitud de posibilidades aún por explorar.
Con la tecnología empleada y basada en redes neuronales profundas, inicialmente se buscaron no menos de 20 horas de audios de entrenamiento para generar un modelo de calidad. Sin embargo, en este caso, la dificultad de encontrar audios en buen estado, limpios de ruidos y en el estilo narrativo que se buscaba, hizo que el modelo tuviera que generarse con tan solo 6 horas, compuestas principalmente por discursos navideños del Dictador. Con este limitado material y la aplicación de tecnología avanzada de Inteligencia Artificial, Vicomtech ha hecho posible la generación de un modelo de síntesis de habla realista que adquiere finalmente todas las particularidades, matices y estilo de la voz de Franco.
La tecnología desarrollada ha sido el resultado de varias semanas de trabajo y la implicación del Grupo de investigación de Tecnologías del Habla y del Lenguaje Natural de Vicomtech.
La serie de podcast XRey es una producción de The Story Lab disponible en exclusiva en Spotify que repasa las luces y las sombras sobre la figura del rey emérito a través de diez episodios de unos 20 minutos de duración.
En el bonus track que se ha publicado con fecha 2 de junio como complemento a los capítulos de la serie, se explica en detalle cómo ha sido el proceso de clonación de esta voz y los objetivos con los que se ha realizado.
Bonus Track "Cómo la inteligencia artificial recreó la voz de Franco"