Aprendizaje supervisado eficiente para el análisis de datos geográficos a gran escala
Autor: Javier Lozano Silva
Directores: Marco Quartulli (Vicomtech) Ekaitz Zulueta (Universidad)
Universidad: UPV/EHU
Fecha: 14.12.2015
Lugar: Escuela Técnica Superior de Ingeniería de Bilbao
El presente trabajo de tesis doctoral tiene como objetivo comprobar la viabilidad de la integración de funcionalidades de aprendizaje automático en servidores de mapas web. La validación de esta hipótesis se ha realizado mediante su implementación en un prototipo pre-operacional. Esta implementación ha consistido en el desarrollo de una plataforma para el mapeo temático sobre imágenes de teledetección de muy alta resolución mediante aprendizaje supervisado a través de una plataforma web. Integrando las capacidades de escalabilidad de los modernos algoritmos de aprendizaje automático y las de los servidores de mapas web, la hipótesis supera el estado del arte actual, caracterizado por la separación de los dos ámbitos que requiere la continua aportación del experto de teledetección en tareas de mapeo temático intensivo. Mediante esta aportación, se abre el campo aplicativo referido a la creación semi-automática de mapas temáticos dedicados y a gran escala en diferentes ámbitos. Estos van desde la agricultura hasta la monitorización medioambiental, por parte de usuarios expertos de dichos dominios aplicativos y sin conocimientos específicos sobre técnicas de teledetección. Dicho desarrollo se fundamenta en facilitar la explotación de datos de teledetección mediante plataformas de aprendizaje automático de fácil acceso que aumenten las capacidades de análisis de datos, de forma que los campos aplicativos puedan expandirse. Estas capacidades pueden concretarse en algoritmos de etiquetado semántico basados en métodos de clasificación supervisada, de forma que un mapa temático pueda ser generado a partir de datos raster adquiridos por sistemas de teledetección y en función de las necesidades del usuario. Para ello, es necesaria la integración de capacidades de aprendizaje automático dentro del servidor de mapas web, junto con una interfaz sencilla que permita la navegación geoespacial y la supervisión del aprendizaje. El carácter adaptativo del aprendizaje, junto con su integración en un servidor web, requiere un algoritmo de clasificación con una gestión y procesamiento de datos eficiente en términos de tiempo de procesamiento compatibles con la navegación web tradicional. Al mismo tiempo, el volumen de datos gestionado por aplicaciones de teledetección motiva el traslado de la metodología a entornos en la nube bajo el paradigma Big Data.