Vicomtech pone a disposición de ASAM su sistema innovador de descripción de contenido de vídeo (VCD)
Vicomtech ha puesto el lenguaje de descripción de contenido de video (VCD) a disposición de ASAM como base para la aplicación y el futuro desarrollo de la iniciativa ASAM OpenLABEL. VCD proporciona un sistema de especificación de metadatos para la descripción de escenas y secuencias de datos, como por ejemplo vídeo o nubes de puntos, permitiendo anotaciones de objetos en espacio y tiempo. VCD incluye además tecnología semántica para describir eventos y relaciones entre ellos.
03.08.2020
VCD define los formatos de especificación de metadatos para el etiquetado de datos multisensoriales y la descripción de la escena. Su objetivo a largo plazo es tender un puente entre los datos capturados por el sensor y la extracción del escenario que genera datos etiquetados que se utilizan para el entrenamiento y la validación de las funciones del sensor y la conducción.
Vicomtech ha decidido poner VCD a disposición de la comunidad de investigación y la industria y permitir que se use como plataforma de lanzamiento para el formato de anotación del nuevo estándar ASAM OpenLABEL, que actualmente se está debatiendo y desarrollando. El lanzamiento de VCD ayudará a garantizar un apoyo suficiente a largo plazo para el estándar en la organización neutral de estandarización. Dada su competencia y misión, ASAM promoverá y desarrollará aún más OpenLABEL gracias al importante número de expertos en Industria e Investigación de todo el mundo que contribuyen a sus actividades de estandarización. Después del lanzamiento de ASAM OpenLABEL 1.0, el estándar estará disponible de forma gratuita para la comunidad de investigación y la industria. Paralelamente, VCD evolucionará para convertirse en el primer lenguaje de etiquetado totalmente compatible con OpenLABEL, con una API de código abierto que estará disponible a través de Github y otros marcos (Pypi, npm, etc.)
Sobre VCD: el etiquetado de datos es un problema importante y costoso en sectores que buscan crear y usar etiquetas fiables básicas para archivos de video masivos. La anotación de configuraciones de sensores múltiples con múltiples cámaras y otros dispositivos (por ejemplo, LIDAR, Radar) es de especial relevancia para el sector automotriz que se dedica a construir funciones de conducción autónoma (AD).
VCD consiste en la primera estructura y conjunto de herramientas de metadatos de código abierto capaz de estructurar anotaciones para escenas altamente complejas, e incluye una flexibilidad sin precedentes para etiquetar objetos 2D y 3D, etiquetas en forma de píxeles, acciones, eventos, contextos, relaciones semánticas y capacidad para organizarlas para múltiples sensores sincronizados.
VCD proporciona un sistema de anotación robusto, flexible y eficiente que cumple con los siguientes requisitos:
- Anotación de grabaciones multicámara y multisensor
- Gestión de marcas de tiempo para sincronización de eventos
- Anotación en línea para unidades de procesamiento en el vehículo
- Vinculación a la semántica basada en ontología
- Capacidades de búsqueda robustas
- Extensibilidad y escalabilidad comprobadas
Más información disponible sobre VCD en GitHub y https://vcd.vicomtech.org/