Dialogue & Speech
Son las tecnologías que facilitan una interacción natural entre una persona y un ordenador, y las metodologías que proporcionan los conceptos, técnicas y herramientas para el tratamiento del habla a través del procesamiento digital de la señal. Gracias a los recientes avances en Inteligencia Artificial, la aplicación práctica de tecnologías como sistemas de diálogo (dialogue systems) o reconocimiento y síntesis de voz (speech recognition & synthesis) en múltiples sectores son cada vez más factibles, mejorando las interacciones persona-máquina o el procesamiento y explotación de contenidos digitales en múltiples idiomas, incluido el euskera.
Sistemas de diálogo, chatbots y asistentes digitales
Los asistentes digitales inteligentes son una de las tecnologías más disruptivas y habilitadoras de la nueva generación de soluciones basadas en Inteligencia Artificial. Gracias al aprendizaje profundo y algoritmos basados en procesos estocásticos son capaces, entre otras cosas, de comprender las necesidades del usuario, extraer su perfil y generar recomendaciones teniendo en cuenta el contexto. Dada la transversalidad de los asistentes conversacionales, se pueden adaptar a múltiples dominios (médico, administrativo, comercial, empresarial, industrial, etc.-), creando interfaces inteligentes que permiten una interacción más natural, directa e intuitiva con la tecnología.
Transcripción y subtitulación automáticas
Nuestro equipo cuenta con una alta especialización científica, múltiples casos de transferencia real y experiencia internacional de primer nivel en tecnologías de transcripción enriquecida y subtitulación automáticas de video y audio en múltiples idiomas y modos operacionales (offline & online), tecnología basada en la librería propietaria Transkit, en constante evolución. Estos activos tecnológicos basados en técnicas de Deep Learning han sido aplicados en variados escenarios de alto reto tecnológico, tales como conversaciones telefónicas, contenidos televisivos, portales públicos de transparencia, sesiones parlamentarias, transcripción de reuniones, entornos de seguridad, etc.
Síntesis de voz, biometría vocal, emociones, …
En Dialogue & Speech se disponen de otros activos tecnológicos que permiten desarrollar aplicaciones relevantes para los sectores identificados. Al igual que en nuestros sistemas de reconocimiento de habla, las arquitecturas End-to-End de nuestros sintetizadores de habla nos permiten generar voces sintéticas naturales y expresivas en múltiples idiomas o reconocer emociones en el habla. Además, nuestra librería BioVoice incorpora las funcionalidades para entrenar sistemas biométricos de voz para reconocer o verificar la identidad de un hablante.
Caso de éxito
- Publicaciones
- Proyectos destacados
¿Buscas apoyo para tu próximo proyecto? Escríbenos, estamos deseando ayudarte.