Computación en la Frontera para el Reconocimiento de Voz en Entornos Industriales

Authors: Ander García Gangoiti

Date: 12.07.2022


Abstract

Las nuevas interfaces de interacción basadas en voz tienen un gran potencial de impacto en entornos industriales. La complejidad computacional de las tecnologías de reconocimiento de voz es elevada, por lo que este tipo de aplicaciones se suele basar en modelos de computación en la nube. Sin embargo, los problemas de latencia y privacidad asociados a la nube invalidan su uso en muchos entornos industriales. Este artículo presenta y valida una arquitectura de computación en la frontera para la integración de interfaces de voz en aplicaciones industriales. La arquitectura está orientada a su despliegue en dispositivos de interacción, principalmente microcontroladores de bajo coste basados en sistemas embebidos. Los operarios interactúan con estos microcontroladores a través de equipamientos de audio Bluetooth. Los microcontroladores capturan el audio y lo envían a un servidor situado en la frontera para que lo transcriba, identifique los comandos del operario y los envíe de vuelta al dispositivo de interacción para que actúe sobre el equipamiento industrial. La arquitectura se ha validado en un sistema de apoyo al montaje de placas electrónicas y una aplicación formativa de vídeo, integrando el reconocimiento de voz para aumentar la eficiencia de los operarios.

BIB_text

@Article {
author = {Ander García Gangoiti},
title = {Computación en la Frontera para el Reconocimiento de Voz en Entornos Industriales},
pages = {169-174},
keywds = {
Industria 4.0, Computación Frontera, Reconocimiento de Voz, Arquitectura, Interfaces de Interacción
}
abstract = {

Las nuevas interfaces de interacción basadas en voz tienen un gran potencial de impacto en entornos industriales. La complejidad computacional de las tecnologías de reconocimiento de voz es elevada, por lo que este tipo de aplicaciones se suele basar en modelos de computación en la nube. Sin embargo, los problemas de latencia y privacidad asociados a la nube invalidan su uso en muchos entornos industriales. Este artículo presenta y valida una arquitectura de computación en la frontera para la integración de interfaces de voz en aplicaciones industriales. La arquitectura está orientada a su despliegue en dispositivos de interacción, principalmente microcontroladores de bajo coste basados en sistemas embebidos. Los operarios interactúan con estos microcontroladores a través de equipamientos de audio Bluetooth. Los microcontroladores capturan el audio y lo envían a un servidor situado en la frontera para que lo transcriba, identifique los comandos del operario y los envíe de vuelta al dispositivo de interacción para que actúe sobre el equipamiento industrial. La arquitectura se ha validado en un sistema de apoyo al montaje de placas electrónicas y una aplicación formativa de vídeo, integrando el reconocimiento de voz para aumentar la eficiencia de los operarios.


}
isbn = {978-1-950492-68-8},
date = {2022-07-12},
}
Vicomtech

Parque Científico y Tecnológico de Gipuzkoa,
Paseo Mikeletegi 57,
20009 Donostia / San Sebastián (Spain)

+(34) 943 309 230

Zorrotzaurreko Erribera 2, Deusto,
48014 Bilbao (Spain)

close overlay

Behavioral advertising cookies are necessary to load this content

Accept behavioral advertising cookies