Vicomtech desarrolla tecnología de seguridad biométrica y antifraude basada en Inteligencia Artificial para impedir la suplantación de la identidad por voz

< Volver

08.06.2020

Los grandes avances de la Inteligencia Artificial (IA) en diferentes campos como el del procesamiento del habla y del lenguaje natural están permitiendo, entre otros progresos, sintetizar o clonar una voz con gran realismo, hasta el punto de poder resultar complicado diferenciar una voz real de otra generada artificialmente. Esta capacidad de clonar voces, incluso de personas ya fallecidas, abre un campo de enormes posibilidades para una nueva narrativa, para la personalización de asistentes conversacionales o incluso para el doblaje, entre otros.

Aun así, la clonación de voz y el deep fake también invitan al desarrollo de técnicas maliciosas relacionadas principalmente con la suplantación de identidad y todas sus posibles aplicaciones.

En Vicomtech desarrollamos tecnología basada en Inteligencia Artificial y en redes neuronales profundas con el fin de detectar si una voz es real o ha sido generada mediante tecnologías de síntesis de voz o conversión de voz. Nuestras tecnologías permiten incluso determinar si una voz corresponde a una grabación realizada de forma encubierta a un usuario legítimo para poder autenticarse en un sistema de verificación por voz suplantando su identidad.

Esta tecnología antifraude (del inglés, anti-spoofing) por voz se puede aplicar en muchos dominios y entornos, como en el de la producción audiovisual, controles de acceso por voz o en centros de llamadas telefónicas.

En Vicomtech contamos con un largo recorrido de investigación en estas tecnologías trabajando con datos aplicables a cualquiera de estos entornos. De hecho, hemos generado recientemente una nueva base de datos llamada ASVspoophone basada en los audios de la base de datos original ASVspoof2019, construida para el reto internacional anti-spoofing ASVspoof2019. La nueva base de datos ASVspoophone incluye los audios transferidos por el canal telefónico y Vicomtech ya ha generado el primer modelo de base capaz de discernir entre voces reales, grabadas, o generadas mediante técnicas de síntesis y conversión de voz. Estos resultados han sido enviados a la conferencia internacional Text, Speech, and Dialogue 2020.

Además de las técnicas anti-spoofing de voz, varios grupos de investigación del Centro están trabajando conjuntamente en el desarrollo e integración de tecnología de procesamiento de lenguaje natural, visión artificial e información de red con el objetivo de dar respuesta a los retos que se presentan relacionados con la detección de bulos y fake news en diferentes sectores de actividad.