Please use this identifier to cite or link to this item:
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1303
Title: | Atenção visual bottom-up guiada por otimização via algoritmos genéticos. |
Other Titles: | Attention-oriented bottom-up visual optimization via genetic algorithms. |
???metadata.dc.creator???: | PEREIRA, Eanes Torres. |
???metadata.dc.contributor.advisor1???: | GOMES, Herman Martins. |
???metadata.dc.contributor.referee1???: | BRASILEIRO, Francisco Vilar |
???metadata.dc.contributor.referee2???: | CARVALHO FILHO, Edson Costa de Barros. |
Keywords: | Visão computacional;Atenção visual bottom-up;Algoritmos genéticos;Grades computacionais;Modelo de Itti - atenção visual;Visual attention bottom-up |
Issue Date: | Mar-2007 |
Publisher: | Universidade Federal de Campina Grande |
Citation: | PEREIRA, Eanes Torres. Atenção visual bottom-up guiada por otimização via algoritmos genéticos. 2007. 135f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraiba - Brasil, 2007. disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1303 |
???metadata.dc.description.resumo???: | A atenção visual é um mecanismo biologicamente inspirado, o qual corresponde à habilidade de selecionar e processar somente as regiões mais relevantes de uma cena visual. Para fins didáticos, a atenção visual pode ser dividida em duas categorias principais: bottom-up e top-down. A atenção visual bottom-up guia o foco de atenção a partir de características primitivas (como descontinuidades de intensidade em diferentes escalas e orientações) computadas diretamente na imagem,sem qualquer informação contextual. A atenção visual top-down, por outro lado, realiza uma busca por regiões de interesse a partir de características de alto nível, especificadas na forma de conhecimento prévio na forma ou modelos sobre o que se está buscando na cena. A principal questão de pesquisa que procuramos responder nessa dissertação é a seguinte: como seria possível agregar algum comportamento de alto nível a um mecanismo típico de atenção visual bottom-up (guiando dessa forma o foco de atenção para classes de regiões pré-estabelecidas)? O modelo mais conhecido de atenção visual bottom-up utiliza vários mapas de características primitivas para formar um mapa de saliência, o qual indica a importância do ponto de vista atencional das diferentes regiões de uma cena. Nesse trabalho, atribuímos pesos aos mapas de características e desenvolvemos um processo de otimização baseado em algoritmos genéticos simulados em uma grade computacional. Foram realizados experimentos com quatro classes de objetos (carros, faces de pessoas, objetos genéricos e pistolas). Os resultados utilizando atenção bottom-up com otimização foram comparados com os resultados de um mecanismo sem otimização de pesos e com um sistema existente que implementa o difundido modelo de atenção visual proposto por Itti et al. [Itti et al., 1998]. Os resultados mostraram ganhos de até 30% utilizando-se a abordagem proposta. Desta forma, este trabalho mostra que a atenção visual pode ser guiada para regiões pré-definidas, podendo ser utilizada como parte de sistemas de detecção de objetos. |
Abstract: | Visual attention is a biologically inspired mechanism, which corresponds to the ability of selecting and processing only the most relevant regions of a visual scene. For didactic purposes, visual attention can be divided into two main categories: bottom-up and top down. Bottom-up visual attention guides the attention focus by using primitive visual features (such as discontinuities in intensity across different scales and orientations) computed directly from the input image,without the need of any context information. Top-down visual attention, on the other side, performs a search for interest regions from higher-level features, specified in the form of previous knowledge or models about what is being sought in the scene. Themain research question that we intended to answer in this dissertation was the following: how it would be possible to incorporate some higher-level be haviour into a typical bottom-up visual attention mechanism (thus guiding the attention focus to pre-established classes of objects)? The most known bottom-up visual attention model uses several primitive feature maps to form a saliency map, which indicates the importance of the different scene regions. In this work, we assigned weights to the feature maps and developed an optimization process based on genetic algorithms running on a computational grid. Experiments involving four object classes (cars, human faces, generic objects and pistols)have been performed. The results of the optimized bottom-up mechanism have been compared with the results of a mechanism not using optimized weights and with an existing system that implemented the well known visual attention mechanism proposed by Itti et al. [Itti et al., 1998]. The results have shown an improvement of up to 30% when using the optimized mechanism. Thus,this work shows that visual attention can indeed be guided towards pre-defined regions and can be used as part of object detection systems. |
Keywords: | Visão computacional Atenção visual bottom-up Algoritmos genéticos Grades computacionais Modelo de Itti - atenção visual Visual attention bottom-up |
???metadata.dc.subject.cnpq???: | Ciência da Computação. |
URI: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1303 |
Appears in Collections: | Mestrado em Ciência da Computação. |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
EANES TORRES PEREIRA - DISSERTAÇÃO PPGCC 2007..pdf | Eanes Torres Pereira - Dissertação PPGCC 2007. | 4.4 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.