Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257
Title: Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.
Other Titles: Design and evaluation of dictionaries for vector quantization of voice and image.
???metadata.dc.creator???: BERNARDINO JÚNIOR, Francisco Madeiro.
???metadata.dc.contributor.advisor1???: AGUIAR NETO, Benedito Guimarães.
ALENCAR, Marcelo Sampaio de.
???metadata.dc.contributor.advisor2???: ALENCAR, Marcelo Sampaio de.
???metadata.dc.contributor.referee1???: ALCAIM, Abraham.
???metadata.dc.contributor.referee2???: CALÔBA, Luiz Pereira.
???metadata.dc.contributor.referee3???: SOUSA, Ricardo Menezes Campello de.
???metadata.dc.contributor.referee4???: CARVALHO, João Marques de.
Keywords: Quantização Vetorial (QV);Sinais de Voz e Imagens;Processamento Digital de Voz;Processamento Digital de Imagem;Processamento da Informação;Dicionários;Algoritmo de Kohonen;Frequency Sensitive SSC (FS-SSC);Edução da Complexidade Computacional;Vector Quantization (QOL);Voice Signals and Images;Digital Voice Processing;Digital Image Processing;Information Processing;Dictionaries;Kohonen's Algorithm;Synaptic Space Competitive (SSC);Frequency Sensitive SSC (FS-SSC);Eduction of Computational Complexity
Issue Date: 14-Dec-2001
Publisher: Universidade Federal de Campina Grande
Citation: BERNARDINO JUNIOR, Francisco Madeiro. Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. 244f. (Tese) Doutorado em Engenharia Elétrica, Curso de Pós-Graduação em Engenharia Elétrica, Centro de Ciências e Tecnologia e Informática ,Universidade Federal da Paraíba – Campus II - Campina Grande - Paraíba - Brasil, 2001.
???metadata.dc.description.resumo???: Neste trabalho são apresentadas técnicas para projeto de dicionários aplicados a quantização vetorial (QV) de sinais de voz e imagens. A primeira. denominada SOA (self organizing algorithm), e inspirada no algoritmo de Kohonen. Utiliza, no entanto, um paradigma de vizinhança diferente do proposto por Kohonen para atualização dos vetores-código. A segunda, denominada SSC (synaptic space competitive), corresponde a nm algoritmo que utiliza aprendizagem competitiva simples. A terceira, denominada FS-SSC (frequency sensitive SSC), e resultante da introdução do principio de consciência de Grossberg no algoritmo SSC. A quarta técnica, denotada por PCA (como alusão a principal component analysis), utiliza os autovalores e os autovetores (componentes principais) da matriz de covariância de um sinal de voz para calcular os vetores-código do dicionário. São apresentados resultados concernentes a codificação de sinais de voz e imagem baseada em QV simples (convencional) como também em QV no dominio wavelet, alem de resultados referentes ao reconhecimento de locutores baseado em QV paramétrica. Os resultados mostram que os algoritmos SOA, SSC, FS-SSC e PCA apresentam~se como altemativas ao tradicional algoritmo LBG (Linde-Buzo-Gray). E investigada a complexidade computacional dos algoritmos SSC e LBG. São obtidas expressões analíticas (em função do tamanho do dicionario, da dimensão dos seus vetores-código, do numero de vetores do conjunto de treino e do numero de iterações desses algoritmos) que estabelecem as condições que devem ser obedecidas para que o algoritmo SSC seja mais eficiente que o algoritmo LBG quanto ao número de operações (divisões, multiplicações, comparações, adições e subtrações) realizadas durante o projeto do dicionario. 0 presente trabalho também apresenta um método para redução da complexidade computacional da etapa de codificação da QV. 0 método proposto utiliza a organização estruturada dos dicionários PCA para reduzir significativamente o numero de operações realizadas na etapa de determinação do vizinho mais próximo de cada vetor a ser codificado bem como para minimizar os requisitos de memória exigida para armazenar o dicionário.
Abstract: This work presents techniques for designing codebooks applied to vector quantization (VQ) of speech signals and images. The first technique, referred to as SOA (selforganizing algorithm), is inspired on Kohonen's algorithm. The unsupervised learning algorithm SOA, however, uses a neighborhood paradigm which differs from that of Kohonen for updating the codevectors. The second, referred to as SSC (synaptic space competitive), corresponds to an algorithm that uses competitive learning. The third, referred to as FS-SSC (frequency sensitive SSC), introduces Grossberg's conscience principle on SSC algorithm. The fourth technique, referred to as PCA (as an allusion to principal component analysis), computes the VQ codebooks taking into account the eigenvalues and the eigenvectors (principal components) of the covariance matrix of a speech signal. This work presents results concerning speech and image coding based upon simple (conventional) VQ and based upon wavelet VQ, as well as results regarding speaker recognition based upon parametric VQ. Results show that the algorithms SOA, SSC, FS-SSC and PCA are alternatives to the traditional LBG (Linde-Buzo-Gray) algorithm. The computational complexity of the algorithms SSC and LBG is investigated. Analytical expressions (as a function of the codebook size, the dimension of the codevectors, the number of vectors in the training set and the number of iterations executed for codebook design) are derived for the number of operations (multiplications, divisions, additions, subtractions and comparisons) executed by SSC and LBG. Constraints are obtained under which the SSC algorithm is more efficient than the LBG algorithm in terms of number of operations executed in codebook design. The work also presents a method for reducing the computational complexity of the minimum distortion encoding (MDE) of VQ. The proposed method uses the structured organization of the PCA codebooks for significantly reducing the number of operations executed in the process of determining the nearest neighbor for each source vector to be coded, as well as for reducing the memory requirements for codebook storage.
Keywords: Quantização Vetorial (QV)
Sinais de Voz e Imagens
Processamento Digital de Voz
Processamento Digital de Imagem
Processamento da Informação
Dicionários
Algoritmo de Kohonen
Frequency Sensitive SSC (FS-SSC)
Edução da Complexidade Computacional
Vector Quantization (QOL)
Voice Signals and Images
Digital Voice Processing
Digital Image Processing
Information Processing
Dictionaries
Kohonen's Algorithm
Synaptic Space Competitive (SSC)
Frequency Sensitive SSC (FS-SSC)
Eduction of Computational Complexity
???metadata.dc.subject.cnpq???: Engenharia Elétrica
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257
Appears in Collections:Doutorado em Engenharia Elétrica.

Files in This Item:
File Description SizeFormat 
FRANCISCO MADEIRO BERNARDINO JUNIOR - TESE PPGE 2001.pdfFrancisco Madeiro Bernardino Júnior - Tese de Doutorado PPGE 2001. 15.48 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.