Obtención de información tridimensional de una escena a partir de sensores plenópticos usando procesamiento de señales con hardware gráfico

  1. José Gil Marichal Hernández
Supervised by:
  1. Fernando Luis Rosa González
  2. José Manuel Rodríguez Ramos

Defence university: Universidad de La Laguna

Year of defence: 2012

Department:
  1. Ingeniería Industrial

Type: Thesis

Abstract

Las cámaras plenópticas preservan las componentes angulares y posicionales de la información visual de una escena, aumentando las posibilidades de procesamiento tras la exposición respecto a lo ofrecido por una cámara convencional. En esta tesis se estudia el procesamiento para el enfoque digital, a posteriori, de una imagen plenóptica. Este enfoque se puede realizar sobre la misma ubicación en que sucedería de tratarse de una cámara convencional, o bien en planos desplazados hacia delante o hacia atrás sobre el eje óptico, generando lo que se conoce como un volumen focal de la escena. Cuando se pretende analizar esta totalidad de planos de reenfoque, en lugar de solo uno, es conveniente utilizar algoritmos rápidos. Con tal fin surgió la técnica de fotografía por «slice de Fourier», que conlleva la transformación de la imagen plenóptica 4D al dominio de Fourier, y la posterior conformación de planos de imagen 2D reenfocados mediante un procesamiento en el dominio transformado y posterior inversión. Esta tesis contribuye a la aceleración de dicho procesado proponiendo el cómputo del algoritmo básico de la transformada rápida de Fourier sobre hardware masivamente paralelo y de bajo costo, las unidades de procesamiento gráfico, GPU. Se concluye que la aplicación de la variante de Pease y una descomposición adecuada de las bases de cómputo permite la aceleración de la FFT sobre esta plataforma. Esta reducción en los tiempos de cómputo se aplica en el campo de la óptica adaptativa, lográndose la recuperación modal de la fase del frente de onda de un sensor Hartmann-Shack en una fracción del tiempo requerido de realizarse sobre una CPU. Como aún con la aceleración lograda con la FFT no se puede garantizar el procesamiento de un volumen focal en tiempos de adquisición de video, se propone un método computacionalmente menos costoso para hallar con una sola transformación el volumen focal. Para ello se ha extendido la transformada discreta de Radon, hasta ahora solo planteada en 2 y 3 dimensiones, para que partiendo de una imagen plenóptica 4D obtenga directamente como resultado un volumen focal 3D. El algoritmo que se obtiene reduce más de un 90% los tiempos del mejor algoritmo disponible hasta el momento. Adicionalmente se realizan consideraciones sobre la posibilidad de extraer un mapa denso de distancias al analizar las profundidades en que los distintos objetos presentes en la escena se enfocan dentro del volumen focal.