Reconhecimento de atividades humanas violentas em videovigilância utilizando redes neurais profundas e delimitação de área de interesse.

Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29315

Title:	Reconhecimento de atividades humanas violentas em videovigilância utilizando redes neurais profundas e delimitação de área de interesse.
Other Titles:	Recognition of violent human activities in video surveillance using deep neural networks and delineation of area of interest. Reconocimiento de las actividades humanas violentas en videovigilancia utilizando redes neuronales profundas y delimitación de Area de interes.
???metadata.dc.creator???:	SILVA, Jayne de Morais.
???metadata.dc.contributor.advisor1???:	PEREIRA, Eanes Torres.
???metadata.dc.contributor.referee1???:	GOMES, Herman Martins.
???metadata.dc.contributor.referee2???:	MIRANDA, Péricles Barbosa Cunha de.
Keywords:	Inteligência artificial;Visão computacional;Reconhecimento de atividades humanas;Violência;Artificial intelligence;Computer vision;Recognition of Human Activities;Violence;Visión por computador;Reconocimiento de actividades humanas
Issue Date:	4-Aug-2022
Publisher:	Universidade Federal de Campina Grande
Citation:	SILVA, Jayne de Morais. Reconhecimento de atividades humanas violentas em videovigilância utilizando redes neurais profundas e delimitação de área de interesse. 2022. 143 fl. Dissertação (Mestrado em Ciência da Computação ), Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29315
???metadata.dc.description.resumo???:	O crescimento da quantidade de câmeras de videovigilância implantadas para o monitora- mento de ambientes nos últimos anos não é proporcional à capacidade humana de análise das cenas capturadas. As cenas capturadas podem conter evidências de ocorrências de crimes. No entanto, câmeras de videovigilância são pouco utilizadas para interromper ou prever atividades criminosas simultaneamente a suas ocorrências. Para tornar o combate ao crime mais eficiente, o reconhecimento de ações humanas poderia ser realizado automaticamente por meio de técnicas computacionais capazes de detectar e classificar os tipos de comportamentos huma- nos. Além disso, no cenário de reconhecimento de padrões em sistemas de videovigilância, outro grande desafio é definir um limiar entre eventos violentos e não-violentos em ambientes em constante mudança e de comportamentos com interpretações ambíguas, considerando o contexto em que são realizados. Por esse motivo, como a natureza das cenas capturadas a partir de câmeras de videovigilância é constituída em sua maior parte de comportamentos comuns ou não violentos, o monitoramento de cenas requer que a capacidade de análise e percepção de atos agressivos seja precisa e acurada. Neste trabalho, é apresentada uma proposta para a detecção de comportamentos humanos violentos através de técnicas de visão computacional, tendo como principal contribuição a delimitação da área de interesse do quadro por meio do filtro gaussiano, como também, a redução do espaço de características de entrada para o modelo, mantendo as características mais relevantes. Além disso, a proposta é capaz de reduzir em aproximadamente até 45% o uso de memória VRAM (Video Random Access Memory) durante a fase de treinamento. A abordagem proposta obteve acurácia de 86,5% na fase de teste com o conjunto de dados RWF-2000 e superou a abordagem baseline, constituída por uma rede neural convolucional (CNN) treinada para a classificação de cenas humanas violentas, combinada com a técnica de corte da área de interesse dos quadros de vídeos. A abordagem também superou outras propostas do estado da arte no cenário de videovigilância. Análises estatísticas realizadas apontam a significância da melhoria dos resultados ao adotar-se o método proposto nesta pesquisa. A proposta também foi avaliada em conjuntos de dados de benchmark em cenários de brigas humanas.
Abstract:	The growth in the number of video surveillance cameras deployed for monitoring environ- ments in recent years is not proportional to the human capacity to analyze the captured scenes. Captured scenes may contain evidence of crime occurrences. However, video surveillance cameras are rarely used to stop or predict criminal activities simultaneously with their occur- rences. To make crime fighting more efficient, the recognition of human actions could be performed automatically by means of computational techniques capable of detecting and clas- sifying the types of human behavior. Moreover, in the scenario of pattern recognition in video surveillance systems, another major challenge is to define a threshold between violent and non-violent events in changing environments and behaviors with ambiguous interpretations, considering the context in which they are performed. For this reason, as the nature of the scenes captured from video surveillance cameras consists mostly of common or non-violent behaviors, scene monitoring requires precision and accuracy on the ability to analyze and perceive aggressive actions. In this work, a proposal for the detection of violent human behavior through computer vision techniques is presented, having as main contribution the delimitation of the area of interest of the frame through the Gaussian filter, as well as the reduction of the space of input features for the model, keeping the most relevant features. Furthermore, the proposal is able to reduce the use of VRAM (Video Random Access Me- mory) by approximately up to 45% during the training phase. The proposed approach obtained accuracy of 86.5% in the test phase with the RWF-2000 dataset and outperformed the baseline approach, consisting of a convolutional neural network (CNN) trained for the classification of violent human scenes, combined with the technique of cutting the area of interest from the video frames. The approach also outperformed other state-of-the-art proposals in the video surveillance scenario. A performed analysis, pointed statistical significance when adopting the method proposed in this research. The proposal was also evaluated on benchmark datasets in human fight scenarios.
???metadata.dc.description.resumen???:	El crecimiento en el número de cámaras de videovigilancia desplegadas para el seguimiento El desarrollo de los entornos en los últimos años no es proporcional a la capacidad humana para analizar el escenas capturadas. Las escenas capturadas pueden contener evidencia de ocurrencias delictivas. En el Sin embargo, las cámaras de videovigilancia rara vez se utilizan para interrumpir o predecir actividades. actividades delictivas simultáneamente con sus ocurrencias. Para que la lucha contra el crimen sea más eficiente, el reconocimiento de las acciones humanas podría realizarse automáticamente a través de técnicas computacionales capaces de detectar y clasificar tipos de comportamiento humano a nosotros. Además, en el escenario del reconocimiento de patrones en los sistemas de videovigilancia, otro desafío importante es definir un umbral entre eventos violentos y no violentos en entornos en constante cambio y comportamientos con interpretaciones ambiguas, considerando la contexto en el que se llevan a cabo. Por ello, como la naturaleza de las escenas captadas de las cámaras de videovigilancia se compone principalmente de comportamientos comunes o no violentos, el monitoreo de la escena requiere la capacidad de analizar y la percepción de los actos agresivos es precisa y exacta. En este trabajo, un propuesta para la detección de conductas humanas violentas a través de técnicas de visión computacional, teniendo como principal aporte la delimitación del área de interés de la marco a través del filtro gaussiano, así como la reducción del espacio de características de entrada al modelo, manteniendo las características más relevantes. Además, la propuesta es capaz de reducir el uso de la memoria VRAM en aproximadamente un 45% (Video Random Memoria de acceso) durante la fase de entrenamiento. El enfoque propuesto obtuvo una precisión de 86.5% en la fase de prueba con el conjunto de datos RWF-2000 y superó el enfoque de referencia, constituida por una red neuronal convolucional (CNN) entrenada para la clasificación de escenas imágenes humanas violentas, combinado con la técnica de cortar el área de interés de los marcos de vídeos El enfoque también superó otras propuestas de vanguardia en el video vigilancia. Los análisis estadísticos realizados apuntan a la importancia de la mejora de resultados al adoptar el método propuesto en esta investigación. La propuesta también fue evaluada en conjuntos de datos de referencia en escenarios de lucha humana.
Keywords:	Inteligência artificial Visão computacional Reconhecimento de atividades humanas Violência Artificial intelligence Computer vision Recognition of Human Activities Violence Visión por computador Reconocimiento de actividades humanas
???metadata.dc.subject.cnpq???:	Ciência da Computação
URI:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29315
Appears in Collections:	Mestrado em Ciência da Computação.

Files in This Item:

File	Description	Size	Format
JAYNE DE MORAIS SILVA – DISSERTAÇÃO PPGCC 2022.pdf	Jayne de Morais Silva - Dissertação PPGCC 2022	2.32 MB	Adobe PDF	View/Open

Show full item record