Vicomtech pone a disposición de ASAM su sistema innovador de descripción de contenido de vídeo (VCD)

< Volver

03.08.2020

VCD define los formatos de especificación de metadatos para el etiquetado de datos multisensoriales y la descripción de la escena. Su objetivo a largo plazo es tender un puente entre los datos capturados por el sensor y la extracción del escenario que genera datos etiquetados que se utilizan para el entrenamiento y la validación de las funciones del sensor y la conducción.

Vicomtech ha decidido poner VCD a disposición de la comunidad de investigación y la industria y permitir que se use como plataforma de lanzamiento para el formato de anotación del nuevo estándar ASAM OpenLABEL, que actualmente se está debatiendo y desarrollando. El lanzamiento de VCD ayudará a garantizar un apoyo suficiente a largo plazo para el estándar en la organización neutral de estandarización. Dada su competencia y misión, ASAM promoverá y desarrollará aún más OpenLABEL gracias al importante número de expertos en Industria e Investigación de todo el mundo que contribuyen a sus actividades de estandarización. Después del lanzamiento de ASAM OpenLABEL 1.0, el estándar estará disponible de forma gratuita para la comunidad de investigación y la industria. Paralelamente, VCD evolucionará para convertirse en el primer lenguaje de etiquetado totalmente compatible con OpenLABEL, con una API de código abierto que estará disponible a través de Github y otros marcos (Pypi, npm, etc.)

Sobre VCD: el etiquetado de datos es un problema importante y costoso en sectores que buscan crear y usar etiquetas fiables básicas para archivos de video masivos. La anotación de configuraciones de sensores múltiples con múltiples cámaras y otros dispositivos (por ejemplo, LIDAR, Radar) es de especial relevancia para el sector automotriz que se dedica a construir funciones de conducción autónoma (AD).

VCD consiste en la primera estructura y conjunto de herramientas de metadatos de código abierto capaz de estructurar anotaciones para escenas altamente complejas, e incluye una flexibilidad sin precedentes para etiquetar objetos 2D y 3D, etiquetas en forma de píxeles, acciones, eventos, contextos, relaciones semánticas y capacidad para organizarlas para múltiples sensores sincronizados.

VCD proporciona un sistema de anotación robusto, flexible y eficiente que cumple con los siguientes requisitos:

Anotación de grabaciones multicámara y multisensor
Gestión de marcas de tiempo para sincronización de eventos
Anotación en línea para unidades de procesamiento en el vehículo
Vinculación a la semántica basada en ontología
Capacidades de búsqueda robustas
Extensibilidad y escalabilidad comprobadas

Más información disponible sobre VCD en GitHub y https://vcd.vicomtech.org/