According to worldwide statistics, traffic accidents are the cause of a high percentage of violent deaths. The time taken to send the medical response to the accident site is largely affected by the human factor and correlates with survival probability. Due to this and the wide use of video surveillance and intelligent traffic systems, an automated traffic accident detection approach becomes desirable for computer vision researchers. Nowadays, Deep Learning (DL)-based approaches have shown high performance in computer vision tasks that involve a complex features relationship. Therefore, this work develops an automated DL-based method capable of detecting traffic accidents on video. The proposed method assumes that traffic accident events are described by visual features occurring through a temporal way. Therefore, a visual features extraction phase, followed by a temporary pattern identification, compose the model architecture. The visual and temporal features are learned in the training phase through convolution and recurrent layers using built-from-scratch and public datasets. An accuracy of 98% is achieved in the detection of accidents in public traffic accident datasets, showing a high capacity in detection independent of the road structure.
Objetivo: Usar técnicas computacionales para eliminar lluvia en imágenes. La motivación viene dada por el hecho de que, para muchos sistemas de visión por computadora, capturar correctamente la escena es clave, y si estos sistemas reciben imágenes degradadas por lluvia como entrada, su funcionamiento puede verse comprometido. Metodología: Se creó un conjunto de datos compuesto por 11000 imágenes sintéticas de lluvia. Estas fueron redimensionadas y normalizadas, para luego utilizar 9000 de ellas como conjunto de entrenamiento en la arquitectura autoencoder. El autoencoder genera una versión sin lluvia de la imagen, la cual es pasada a una etapa de corrección de iluminación para producir la imagen final sin lluvia. Resultados: Se encontró que el mejor desempeño lo tenía el autoencoder de 6 capas. Se evaluó con las 2000 imágenes restantes, lo que resultó en un error cuadrático medio de 0,61 y un índice de similitud estructural de 0,8493, lo que significa que el modelo fue capaz de recuperar una gran cantidad de información original de las imágenes degradadas por la lluvia. Conclusiones: Los resultados obtenidos son superiores a aquellos de la literatura que se basan en el dominio espacial / frecuencial. Se determinó, sin embargo, que es posible obtener mejores resultados si se considera el dominio de la frecuencia como parte de la arquitectura, debido a las propiedades de esta. Por lo tanto, se propone como trabajo futuro combinar enfoques basados en el aprendizaje de máquina con el procesamiento de imágenes basado en el dominio de la frecuencia.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.