Recuperación de la geometría de una escena a partir de imágenes plenópticas aplicando técnicas locales

  1. Lüke, Jonas Philipp
Dirigida por:
  1. Fernando Luis Rosa González Director

Universidad de defensa: Universidad de La Laguna

Fecha de defensa: 11 de abril de 2014

Tribunal:
  1. Casiano Rodríguez León Presidente
  2. Rafael Pérez-Jiménez Secretario/a
  3. Manuel Martínez Corral Vocal
Departamento:
  1. Ingeniería Industrial

Tipo: Tesis

Teseo: 354965 DIALNET lock_openRIULL editor

Resumen

En los últimos años, se han producido notables avances en la captura y procesamiento de imágenes con la finalidad de obtener la información tridimensional de la escena frente a la cámara. Para ello se utiliza el concepto de light field, una función de cuatro dimensiones que recoge la intensidad de los rayos de luz que atraviesan el espacio vacío en cada punto del mismo. Dicha función se puede capturar mediante diversos dispositivos. Una vez capturado, el light field permite sintetizar imágenes reenfocadas a distintas distancias o desde distintos puntos de vista. Además, estos datos se pueden utilizar para recuperar la información tridimensional de la escena, ya que se preserva la información angular. Esta tesis doctoral se ha centrado en el procesamiento del light field para la obtención de estimaciones de distancias mediante métodos locales. Inicialmente, se expusieron los métodos empleados para obtener un conjunto de light fields, tanto reales como sintéticos, que permitieron comprobar la eficacia del método de estimación de distancias propuesto. Seguidamente se desarrolló un nuevo el operador local para la medida de distancias a partir del light field, que constituye la contribución central de esta tesis doctoral. Dicho operador local se basa en la estimación de la orientación de los planos generados por los objetos de la escena en el light field, utilizando para ello la información que contienen los gradientes, teniendo en cuenta la naturaleza 4D del light field, así como la ligadura entre ambos vectores directores de estos planos. Esta forma de proceder permite obtener una medida de distancia para cada rayo del light field, salvo en zonas con insuficiente textura. Como el objetivo era obtener un único mapa de distancias, se propuso un método para combinar los múltiples mapas obtenidos en un marco de referencia común. Aún disponiendo de un número elevado de medidas, el mapa resultante de la combinación puede contener zonas vacías, sin medidas. Por ello, se propuso rellenar estas zonas utilizando el modelo TV-L1 optimizado mediante el método split Bregman. Dicho modelo ha sido aplicado anteriormente en la regularización de mapas de distancias y el método split Bregman también es un método conocido para optimizar el modelo TV-L1. Sin embargo, la aplicación de este último a la regularización de mapas de distancias no es conocida y aporta la ventaja de su fácil paralelización e implementación sobre GPU. También se han explorado algunas variantes del método para aliviar el cálculo, utilizando una técnica de jerarquización en el caso de imágenes estáticas y, por otro lado, encadenando resultados de frames sucesivos en el procesamiento de secuencias temporales. Las pruebas, realizadas sobre distintos conjuntos de datos, revelan que el método propuesto mejora a otros métodos de estimación de distancias a partir de light fields, tanto en precisión como en tiempos de ejecución, existiendo aún posibilidad de mejora en estos últimos. Además, el método permite obtener la información de la distancia utilizando un número reducido de muestras angulares, sin que esto afecte significativamente a la precisión de los resultados. Por último, la complejidad computacional del método propuesto tampoco tiene dependencia de la resolución de la variable distancia.