Aperfeiçoando o reconhecimento óptico de caracteres em imagens de documentos pessoais.

Página inicial
→
Campus Campina Grande | Centro de Engenharia Elétrica e Informática - CEEI
→
CURSOS DE GRADUAÇÃO DO CEEI
→
Curso de Bacharelado em Ciência da Computação
→
Trabalho de Conclusão de Curso - Artigo - Ciência da Computação
→
Ver item

dc.creator.ID	FARIAS, W. N.	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/5834360324217282	pt_BR
dc.contributor.advisor1	GOMES, Herman Martins.
dc.contributor.advisor1ID	GOMES, H. M.	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/4223020694433271	pt_BR
dc.contributor.referee1	PEREIRA, Eanes Torres.
dc.contributor.referee1ID	PEREIRA, E. T.	pt_BR
dc.contributor.referee1Lattes	http://lattes.cnpq.br/2030738304003254	pt_BR
dc.contributor.referee2	BRASILEIRO, Francisco Vilar.
dc.contributor.referee2ID	BRASILEIRO, F.	pt_BR
dc.contributor.referee2Lattes	http://lattes.cnpq.br/5957855817378897	pt_BR
dc.description.resumo	O reconhecimento óptico de caracteres (OCR) desempenha um papel fundamental na digitalização e processamento de documentos pessoais, no entanto, enfrenta desafios significativos de precisão e eficiência, visto que as ferramentas que realizam OCR ainda dependem muito da qualidade da entrada de dados e das condições em que os documentos são escaneados ou fotografados. Para aperfeiçoar o reconhecimento óptico de caracteres (OCR), propõe-se a utilização da combinação de técnicas de pré-processamento e pós-processamento a fim de melhorar a qualidade do OCR. O processo inicia-se através da coleta de um conjunto de dados representativo de imagens de documentos pessoais. Após a coleta, realiza-se o pré-processamento e pós-processamento das imagens, seguindo então do OCR e a utilização de uma métrica que avalia o OCR obtido. As técnicas de pré-processamento incluíram modificação do DPI das imagens, suavização da imagem e conversão para escala de cinza, seguida pela aplicação do OCR. Além disso, houve um pós-processamento para remover a acentuação do texto extraído e convertê-lo em letras maiúsculas. Os resultados indicaram que o pré-processamento melhorou significativamente a precisão do OCR para documentos de identidade (RG), aumentando o F1-Score de 0.33 (sem pré-processamento) para 0.53 (com pré-processamento). Para imagens de CPF, o pré-processamento resultou em uma precisão de 73.48% e uma taxa de erro de 26.52%, enquanto o OCR sem pré-processamento teve uma precisão de 36.46% e uma taxa de erro de 63.54%. Este estudo visa investigar técnicas com o propósito de melhorar o reconhecimento óptico de caracteres em documentos pessoais, contribuindo para maior precisão do OCR, com potenciais benefícios para aplicações que realizam a extração de conteúdo de imagens de documentos pessoais.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Centro de Engenharia Elétrica e Informática - CEEI	pt_BR
dc.publisher.initials	UFCG	pt_BR
dc.subject.cnpq	Ciência da Computação	pt_BR
dc.title	Aperfeiçoando o reconhecimento óptico de caracteres em imagens de documentos pessoais.	pt_BR
dc.date.issued	2023-11-17
dc.description.abstract	Optical character recognition (OCR) plays a key role in the digitization and processing of personal documents, however, it faces accuracy and efficiency challenges, since the tools that perform OCR still depend heavily on the quality of the input data and the conditions in which the documents are scanned or photographed. To improve optical character recognition, it is proposed a combination of pre-processing and post-processing techniques to improve OCR quality. The process begins by collecting a representative dataset of images of personal documents. After that, the images are pre-processed and post-processed, followed by OCR and the use of a metric that evaluates the OCR obtained. Pre-processing techniques included modifying the DPI of the images, smoothing the image and converting it to grayscale, followed by the application of OCR. In addition, post-processing was carried out to remove accents marks from the extracted text and convert it into capital letters. The results indicated that pre-processing method significantly improved OCR accuracy for identity documents (ID), increasing the F1-Score from 0.33 (without pre-processing) to 0.53 (with pre-processing). For CPF images, pre-processing procedure resulted in an accuracy of 73.48% and an error rate of 26.52%, while OCR without pre-processing had an accuracy of 36.46% and an error rate of 63.54%. This study aims to investigate techniques for improving optical character recognition in personal documents, contributing to greater OCR accuracy, with potential benefits for applications that extract content from personal document images.	pt_BR
dc.identifier.uri	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/34848
dc.date.accessioned	2024-03-02T14:11:07Z
dc.date.available	2024-03-02
dc.date.available	2024-03-02T14:11:07Z
dc.type	Trabalho de Conclusão de Curso	pt_BR
dc.subject	Reconhecimento Óptico de Caracteres (OCR)	pt_BR
dc.subject	Documentos Pessoais	pt_BR
dc.subject	Pré-Processamento	pt_BR
dc.subject	Optical Character Recognition (OCR)	pt_BR
dc.subject	Personal Documents	pt_BR
dc.subject	Pre-Processing	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.creator	FARIAS, Walisson Nascimento de.
dc.publisher	Universidade Federal de Campina Grande	pt_BR
dc.language	por	pt_BR
dc.title.alternative	Improving optical character recognition in personal document images.	pt_BR
dc.identifier.citation	FARIAS, Walisson Nascimento de. Aperfeiçoando o reconhecimento óptico de caracteres em imagens de documentos pessoais. 2023. 11 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2023.	pt_BR