En este artículo presentamos tres algoritmos para calcular la fusión de imágenes multi foco. Estos algoritmos se basan en la combinación lineal de un par de imágenes con diferentes niveles de enfoque. Los tres algoritmos maximizan una función lineal con restricciones de coherencia espacial; el objetivo de presentarlos es justificar como llegamos a plantear un algoritmo rápido y simple. El primer algoritmo llamado Combinación Lineal de Imágenes (CLI), se implementó utilizando Wolfram Mathematica, pero dado el número de variables a optimizar, la solución demandó de mucho tiempo de cómputo. El segundo algoritmo llamado Combinación Lineal de Imágenes por Ventanas (CLI-V) es una aplicación, sobre subregiones de las imágenes del algoritmo CLI, mejorando el desempeño en tiempo y logrando la implementación con el método Simplex. El tercer algoritmo llamado Combinación Lineal de Imágenes Simple (CLI-S), es una simplificación del algoritmo CLI-V, con resultados de calidad muy similares a los algoritmos CLI y CLI-V y a algunos algoritmos del estado del arte, pero con tiempos de solución muy rápidos. El algoritmo CLI-S se implementó utilizando imágenes incrementales con el propósito de tener soluciones en centésimas de segundo para las imágenes de prueba utilizadas. Para los tres algoritmos se presenta el desempeño y el tiempo de solución bajo condiciones similares, utilizando un par de imágenes sintéticas y cuatro pares de imágenes reales. Las imágenes reales han sido utilizadas por algoritmos del estado del arte y fueron seleccionadas con el objetivo de que el lector pueda hacer una comparación cualitativa. En el caso del par de imágenes sintéticas se hace una comparación cuantitativa con resultado de 98 % de aciertos en la selección de píxeles, en un tiempo de ejecución de 0.080 s. para una imagen de 512 × 512 píxeles, lo que nos permite decir que la velocidad lograda con algoritmo CLI-S permite efectuar el proceso de fusión en tiempo real, situación que no hemos encontrado reportada en el estado del arte.
ResumenEn este artículo presentamos el Algoritmo Combinación Lineal de Imágenes con Ventanas Variables (CLI-VV) para la fusión de imágenes multi-foco. A diferencia del Algoritmo CLI-S presentado en un trabajo anterior, el algoritmo CLI-VV permite determinar automáticamente el tamañoóptimo de la ventana en cada píxel para la segmentación de las regiones con la mayor nitidez. También presentamos la generalizado el Algoritmo CLI-VV para la fusión de conjuntos de imágenes multi-foco con más de dos imágenes. A este nuevo algoritmo lo denominamos Fusión Multi-foco con Ventanas Variables (FM-VV). El Algoritmo CLI-VV se probó con 21 pares de imágenes sintéticas y 29 pares de imágenes multi-foco reales, y el Algoritmo FM-VV sobre 5 tríos de imáge-nes multi-foco. En todos los ejemplos se obtuvo un porcentaje de acierto competitivos, producidos en tiempos de ejecución menores a los reportados en la literatura. Palabras Clave: Fusión de imágenes multi-foco, Ventanas deslizantes, Imágenes integrales Multi Focus Image Fusion with variable size windows AbstractIn this paper we present the Linear Image Combination Algorithm with Variable Windows (CLI-VV) for the fusion of multifocus images. Unlike the CLI-S algorithm presented in a previous work, the CLI-VV algorithm allows to automatically determine the optimal size of the window in each pixel for the segmentation of the regions with the highest sharpness. We also present the generalized CLI-VV Algorithm for the fusion of sets of multi-focus images with more than two images. This new algorithm is called Variable Windows Multi-focus Fusion (FM-VV). The CLI-VV Algorithm was tested with 21 pairs of synthetic images and 29 pairs of real multi-focus images, and the FM-VV Algorithm on 5 trios of multi-focus images. In all the tests a competitive accuracy was obtained, with execution times lower than those reported in the literature. Keywords:Multi-focus image fusion, Sliding windows, Incremental images. IntroducciónHay muchas aplicaciones en las que se involucran imáge-nes, por ejemplo, en sistemas de seguridad, en fotografía, en apoyo al diagnóstico con imágenes médicas, en imágenes satelitales y en algunos ambientes de investigación. En ellas es deseable que las imágenes obtenidas tengan suficiente claridad o nitidez en todos los objetos de la escena. Sin embargo, lo anterior no siempre es posible pues el rango de distancias medidos desde la lente hasta los objetos que se desean capturar no es constante y las cámaras, microscopios y otros objetos que usan lentes para la captura de las imágenes, tienen limitaciones físicas que impiden que todos los objetos de la escena tengan la misma claridad en la imagen digital generada. A dicha limitación se le conoce como profundidad de campo, término que hace referencia al rango de distancias que la lente de una cáma-ra, con una apertura dada, es capaz de reproducir de manera nítida (Kuthirummal et al., 2011).En términos ideales, la luz reflejada por cada punto de la escena debería incidir sobre unúnico punto en el sensor de la cámara, sin em...
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.