Son las tecnologías que facilitan una interacción natural entre una persona y un ordenador, y las metodologías que proporcionan los conceptos, técnicas y herramientas para el tratamiento del habla a través del procesamiento digital de la señal. Gracias a los recientes avances en Inteligencia Artificial, la aplicación práctica de tecnologías como sistemas de diálogo (dialogue systems) o reconocimiento y síntesis de voz (speech recognition & synthesis) en múltiples sectores son cada vez más factibles, mejorando las interacciones persona-máquina o el procesamiento y explotación de contenidos digitales en múltiples idiomas, incluido el euskera.

Sistemas de diálogo, chatbots y asistentes digitales

Los asistentes digitales inteligentes son una de las tecnologías más disruptivas y habilitadoras de la nueva generación de soluciones basadas en Inteligencia Artificial. Gracias al aprendizaje profundo y algoritmos basados en procesos estocásticos son capaces, entre otras cosas, de comprender las necesidades del usuario, extraer su perfil y generar recomendaciones teniendo en cuenta el contexto. Dada la transversalidad de los asistentes conversacionales, se pueden adaptar a múltiples dominios (médico, administrativo, comercial, empresarial, industrial, etc.-), creando interfaces inteligentes que permiten una interacción más natural, directa e intuitiva con la tecnología.

Transcripción y subtitulación automáticas

Nuestro equipo cuenta con una alta especialización científica, múltiples casos de transferencia real y experiencia internacional de primer nivel en tecnologías de transcripción enriquecida y subtitulación automáticas de video y audio en múltiples idiomas y modos operacionales (offline & online), tecnología basada en la librería propietaria Transkit, en constante evolución. Estos activos tecnológicos basados en técnicas de Deep Learning han sido aplicados en variados escenarios de alto reto tecnológico, tales como conversaciones telefónicas, contenidos televisivos, portales públicos de transparencia, sesiones parlamentarias, transcripción de reuniones, entornos de seguridad, etc.

Síntesis de voz, biometría vocal, emociones, …

En Dialogue & Speech se disponen de otros activos tecnológicos que permiten desarrollar aplicaciones relevantes para los sectores identificados. Al igual que en nuestros sistemas de reconocimiento de habla, las arquitecturas End-to-End de nuestros sintetizadores de habla nos permiten generar voces sintéticas naturales y expresivas en múltiples idiomas o reconocer emociones en el habla. Además, nuestra librería BioVoice incorpora las funcionalidades para entrenar sistemas biométricos de voz para reconocer o verificar la identidad de un hablante.

Caso de éxito

Resivoz. Registro hablado de información mediante asistentes conversacionales

CASER Residencial

conoce el caso de éxito

Publicaciones
Proyectos destacados

2024-11-11

The Vicomtech Speech Transcription Systems for the Albayzín 2024 Bilingual Basque-Spanish Speech to Text (BBS-S2T) Challenge

2024-10-01

Real-Time Speech-Driven Avatar Animation by Predicting Facial landmarks and Deformation Blendshapes

Aritz Lasarguren Jone López Egoitz Rodríguez

2024-09-18

Incremental Learning for Knowledge-Grounded Dialogue Systems in Industrial Scenarios

Izaskun Fernández Cristina Aceta Cristina Fernández María Inés Torres Aitor Etxalar Joseba Agirre Egoitz Artetxe Iker Altuna

2024-09-09

Anonymizing Dysarthric Speech: Investigating the Effects of Voice Conversion on Pathological Information Preservation

Abner Hernández Paula Andrea Pérez Tomás Arias Seung Hee Yang Juan Rafael Orozco Andreas Maier

2024-09-09

Stream-based Active Learning for Speech Emotion Recognition via Hybrid Data Selection and Continuous Learning

2024-09-01

Exploring Self-supervised Embeddings and Synthetic Data Augmentation for Robust Audio Deepfake Detection

Eros Rosello Ángel M. Gómez Antonio M. Peinado

IRAZ

Plataforma de lectura fácil basada en Inteligencia Artificial

COGILE

COGILE hace especial incidencia en el factor humano como vector diferenciador en la fábrica del futuro y como apoyo al trabajador 4.0 en sus fases de la vida laboral

SHAPES

En toda Europa, muchas personas se ven perjudicadas por la reducción de sus capacidades, ya sea de forma permanente o temporal

CAPTAIN

Vivir en un entorno doméstico familiar es fundamental para el bienestar de las personas mayores, especialmente cuando sufren pérdida de memoria. Aunque las tecnologías actuales pueden ser de gran ayuda para las personas mayores que viven solas, aún faltan soluciones de alta tecnología diseñadas específicamente para satisfacer sus necesidades particulares.

MULTIBIO

Servicio de autenticación automático, pasivo y continuado de usuarios de servicios online que requieren un mayor grado de seguridad en la identificación de sus usuarios.

AdapTA

Traducción automática totalmente personalizada basada en la explotación de datos heterogéneos

Contacta con nosotros

¿Buscas apoyo para tu próximo proyecto? Escríbenos, estamos deseando ayudarte.

Dialogue & Speech

Sistemas de diálogo, chatbots y asistentes digitales

Transcripción y subtitulación automáticas

Síntesis de voz, biometría vocal, emociones, …

Caso de éxito

Digital Media & Communications

Digital Platforms & Data Spaces