EMPHASIS: una solución global para la automatización inteligente de procesos en backoffice
EMPHASIS
La integración de tecnologías de procesamiento del habla y lenguaje natural permiten estructurar contenidos no estructurados hasta ahora, como son los documentos (facturas, albaranes, escrituras, permisos de obras, licencias municipales, …), sin necesidad de que tengan que llevar una plantilla asociada, o las llamadas (en call centers por ejemplo).
Se trata de convertir en datos todo ese contenido (documentos y llamadas), para así poder gestionarlo, poder analizarlo y poder optimizar los procesos asociados, para ir avanzando así en una transformación digital real, que de otro modo se antoja imposible. No se trata de hacer digitalmente lo mismo que hacemos hasta ahora. Consiste en partir de datos para definir los flujos y procesos óptimos que garanticen una digitalización total, escalable, robusta, flexible ante cambios, que se pueda adaptar a nuevos escenarios y siempre con unos costes razonables.
Para ello, otro de los factores clave es seguir los principios del no-code, o en su defecto el low-code, es decir, desarrollar soluciones cuya integración e implantación resulten lo más transparentes posible, huyendo de los costosos procesos que suponían las soluciones BPM (del inglés, Business Process Management). Se trata de desarrollar tecnología que se pueda integrar a modo de APIs en soluciones de terceros, con el fin de que su configuración pueda ser realizada por personal no experto. Del mismo modo, se trata de que estas APIs encapsulen funciones que se puedan personalizar, es decir, uno de los objetivos prioritarios del proyecto es que las funciones desarrolladas en el marco del proyecto puedan luego personalizarse y adaptarse a distintos casos de uso, siguiendo los principios del low-code.
Por tanto, estamos hablando de desarrollar soluciones base para el procesamiento de documentos y audios, pero a su vez, hablamos de desarrollar herramientas y sistemas que permitan la personalización de dichas soluciones. Lo explicaremos con un ejemplo, si una de las soluciones base a generar permite clasificar documentos y decir si se trata de una factura o un albarán, se generarán también las herramientas que ayuden en el proceso de anotar otros documentos, y de generar los correspondientes modelos de IA, para que en un futuro la solución personalizada pueda clasificar documentos identificando si es un permiso de obra, una escritura o una licencia municipal.
Vicomtech, en el marco de este proyecto en colaboración con diversos agentes, investigará y desarrollará tecnologías de procesamiento de habla y lenguaje natural basadas en los últimos paradigmas del Deep Learning. Más concretamente, en relación con las tecnologías de procesamiento del habla, Vicomtech se centrará en la implementación de soluciones de transcripción automática, biometría y reconocimiento de emociones en la voz adaptadas a los dominios y necesidades de las empresas. Igualmente, desarrollará intensas actividades de I+D para el desarrollo de soluciones orientadas a la clasificación automática de texto; la detección, reconocimiento y extracción de relaciones entre entidades; la anonimización de datos sensibles, sistemas pregunta/respuesta y la detección de opiniones.
La solución presenta un importante carácter innovador afrontando varios retos tecnológicos para mejorar procesos mediante la extracción, comprensión y estructuración de conocimiento a través de tecnología de procesamiento de habla y lenguaje y gracias a la implementación de herramientas que dotan de autonomía a las empresas a la hora de entrenar tecnología de Inteligencia Artificial.
Principales retos tecnológicos de EMPHASIS
Los principales retos tecnológicos de Emphasis están relacionados con la aplicación de las siguientes tecnologías a diferentes dominios y formatos de audio y texto, junto con el desarrollo de las herramientas para adaptarlas fácilmente a los casos de uso reales de cada cliente:
- Cognitive Document Automation: su objetivo es automatizar la extracción de contenido relevante de fuentes textuales de diferente formato, facturas, albaranes, e-mails, documentos texto, sistemas de FAQs, conversaciones extraídas mediante transcripción automática, para clasificar el contenido en diferentes categorías, dominios, sentimientos, y además extraer las palabras clave y sus relaciones que permitan la comprensión de su contenido. La tecnología a emplear es tecnología de Deep Learning puntera donde se ha visto un cambio de paradigma en los dos últimos años gracias a la proliferación de arquitecturas neuronales avanzadas que explotan modelos de lenguaje con conocimiento del mundo. También se convierte los documentos que contienen imágenes con texto en su interior y se mejora su lectura a partir de la aplicación de métodos avanzados sobre herramientas OCR del estado del arte.
- Speech Analytics: su objetivo es automatizar el análisis de los datos con contenido acústico a través de la transformación a texto mediante herramientas avanzadas de transcripción automática enriquecida del habla y análisis de emociones. La tecnología principal a emplear es tecnología de Deep Learning basada en las últimas aportaciones de la comunidad científica al estado del arte y que ha demostrado grandes mejoras con respeto a la tecnología de Machine Learning anterior.
Emphasis está subvencionado por el programa Hazitek de apoyo a la I+D Empresarial impulsado por SPRI - Sociedad para la Transformación Competitiva - Eraldaketa Lehiakorrerako Sozietatea, S.A., junto al Departamento de Desarrollo Económico, Sostenibilidad y Medio Ambiente de Eusko Jaurlaritza - Gobierno Vasco.
Emphasis está formado por once de las empresas e instituciones con una fuerte trayectoria en la automatización de procesos: Teknei, Merkatu, Segula, Eutik, Naturalvox, Gureak, Ibermática, Zucchetti, Vicomtech, Universidad del País Vasco/Euskal Herriko Unibertsitatea e I3 Instituto Ibermática de Innovación
¿Buscas apoyo para tu próximo proyecto? Escríbenos, estamos deseando ayudarte.