DSpace/Manakin Repository

Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.

Mostrar registro simples

dc.creator.ID BERNARDINO JÚNIOR, F. M. pt_BR
dc.creator.Lattes http://lattes.cnpq.br/1934903225521860 pt_BR
dc.contributor.advisor1 AGUIAR NETO, Benedito Guimarães.
dc.contributor.advisor1 ALENCAR, Marcelo Sampaio de.
dc.contributor.advisor1ID AGUIAR NETO, B. G. pt_BR
dc.contributor.advisor1ID ALENCAR, M. S.
dc.contributor.advisor1Lattes http://lattes.cnpq.br/3405447548131544 pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/0946722048975388
dc.contributor.advisor2 ALENCAR, Marcelo Sampaio de.
dc.contributor.advisor2ID ALENCAR, M. S. pt_BR
dc.contributor.advisor2Lattes http://lattes.cnpq.br/0946722048975388 pt_BR
dc.contributor.referee1 ALCAIM, Abraham.
dc.contributor.referee2 CALÔBA, Luiz Pereira.
dc.contributor.referee3 SOUSA, Ricardo Menezes Campello de.
dc.contributor.referee4 CARVALHO, João Marques de.
dc.description.resumo Neste trabalho são apresentadas técnicas para projeto de dicionários aplicados a quantização vetorial (QV) de sinais de voz e imagens. A primeira. denominada SOA (self organizing algorithm), e inspirada no algoritmo de Kohonen. Utiliza, no entanto, um paradigma de vizinhança diferente do proposto por Kohonen para atualização dos vetores-código. A segunda, denominada SSC (synaptic space competitive), corresponde a nm algoritmo que utiliza aprendizagem competitiva simples. A terceira, denominada FS-SSC (frequency sensitive SSC), e resultante da introdução do principio de consciência de Grossberg no algoritmo SSC. A quarta técnica, denotada por PCA (como alusão a principal component analysis), utiliza os autovalores e os autovetores (componentes principais) da matriz de covariância de um sinal de voz para calcular os vetores-código do dicionário. São apresentados resultados concernentes a codificação de sinais de voz e imagem baseada em QV simples (convencional) como também em QV no dominio wavelet, alem de resultados referentes ao reconhecimento de locutores baseado em QV paramétrica. Os resultados mostram que os algoritmos SOA, SSC, FS-SSC e PCA apresentam~se como altemativas ao tradicional algoritmo LBG (Linde-Buzo-Gray). E investigada a complexidade computacional dos algoritmos SSC e LBG. São obtidas expressões analíticas (em função do tamanho do dicionario, da dimensão dos seus vetores-código, do numero de vetores do conjunto de treino e do numero de iterações desses algoritmos) que estabelecem as condições que devem ser obedecidas para que o algoritmo SSC seja mais eficiente que o algoritmo LBG quanto ao número de operações (divisões, multiplicações, comparações, adições e subtrações) realizadas durante o projeto do dicionario. 0 presente trabalho também apresenta um método para redução da complexidade computacional da etapa de codificação da QV. 0 método proposto utiliza a organização estruturada dos dicionários PCA para reduzir significativamente o numero de operações realizadas na etapa de determinação do vizinho mais próximo de cada vetor a ser codificado bem como para minimizar os requisitos de memória exigida para armazenar o dicionário. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department Centro de Engenharia Elétrica e Informática - CEEI pt_BR
dc.publisher.program PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA pt_BR
dc.publisher.initials UFCG pt_BR
dc.subject.cnpq Engenharia Elétrica
dc.title Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. pt_BR
dc.date.issued 2001-12-14
dc.description.abstract This work presents techniques for designing codebooks applied to vector quantization (VQ) of speech signals and images. The first technique, referred to as SOA (selforganizing algorithm), is inspired on Kohonen's algorithm. The unsupervised learning algorithm SOA, however, uses a neighborhood paradigm which differs from that of Kohonen for updating the codevectors. The second, referred to as SSC (synaptic space competitive), corresponds to an algorithm that uses competitive learning. The third, referred to as FS-SSC (frequency sensitive SSC), introduces Grossberg's conscience principle on SSC algorithm. The fourth technique, referred to as PCA (as an allusion to principal component analysis), computes the VQ codebooks taking into account the eigenvalues and the eigenvectors (principal components) of the covariance matrix of a speech signal. This work presents results concerning speech and image coding based upon simple (conventional) VQ and based upon wavelet VQ, as well as results regarding speaker recognition based upon parametric VQ. Results show that the algorithms SOA, SSC, FS-SSC and PCA are alternatives to the traditional LBG (Linde-Buzo-Gray) algorithm. The computational complexity of the algorithms SSC and LBG is investigated. Analytical expressions (as a function of the codebook size, the dimension of the codevectors, the number of vectors in the training set and the number of iterations executed for codebook design) are derived for the number of operations (multiplications, divisions, additions, subtractions and comparisons) executed by SSC and LBG. Constraints are obtained under which the SSC algorithm is more efficient than the LBG algorithm in terms of number of operations executed in codebook design. The work also presents a method for reducing the computational complexity of the minimum distortion encoding (MDE) of VQ. The proposed method uses the structured organization of the PCA codebooks for significantly reducing the number of operations executed in the process of determining the nearest neighbor for each source vector to be coded, as well as for reducing the memory requirements for codebook storage. pt_BR
dc.identifier.uri http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257
dc.date.accessioned 2020-01-27T18:00:47Z
dc.date.available 2020-01-27
dc.date.available 2020-01-27T18:00:47Z
dc.type Tese pt_BR
dc.subject Quantização Vetorial (QV)
dc.subject Sinais de Voz e Imagens
dc.subject Processamento Digital de Voz
dc.subject Processamento Digital de Imagem
dc.subject Processamento da Informação
dc.subject Dicionários
dc.subject Algoritmo de Kohonen
dc.subject Frequency Sensitive SSC (FS-SSC)
dc.subject Edução da Complexidade Computacional
dc.subject Vector Quantization (QOL)
dc.subject Voice Signals and Images
dc.subject Digital Voice Processing
dc.subject Digital Image Processing
dc.subject Information Processing
dc.subject Dictionaries
dc.subject Kohonen's Algorithm
dc.subject Synaptic Space Competitive (SSC)
dc.subject Frequency Sensitive SSC (FS-SSC)
dc.subject Eduction of Computational Complexity
dc.rights Acesso Aberto pt_BR
dc.creator BERNARDINO JÚNIOR, Francisco Madeiro.
dc.publisher Universidade Federal de Campina Grande pt_BR
dc.language por pt_BR
dc.title.alternative Design and evaluation of dictionaries for vector quantization of voice and image. pt_BR
dc.identifier.citation BERNARDINO JUNIOR, Francisco Madeiro. Projeto e avaliação de dicionários para quantização vetorial de voz e imagem. 244f. (Tese) Doutorado em Engenharia Elétrica, Curso de Pós-Graduação em Engenharia Elétrica, Centro de Ciências e Tecnologia e Informática ,Universidade Federal da Paraíba – Campus II - Campina Grande - Paraíba - Brasil, 2001. pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta