Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29248
Title: Uso de processamento de linguagem natural e aprendizagem de máquina para a extração de informação em editais de licitações não-estruturados.
Other Titles: Use of natural language processing and machine learning to extract information from unstructured public notices.
???metadata.dc.creator???: ANDRADE, Ígor Silveira de.
???metadata.dc.contributor.advisor1???: BAPTISTA, Cláudio de Souza.
???metadata.dc.contributor.referee1???: OLIVEIRA, Maxwell Guimarães de.
???metadata.dc.contributor.referee2???: BRASILEIRO, Francisco Vilar.
Keywords: Aprendizagem de máquina;Linguagem natural;Processamento de linguagem natural;Licitações - editais;Editais de licitações;Machine learning;Natural language;Natural language processing;Tenders - notices;Bidding notices
Issue Date: 2-Sep-2022
Publisher: Universidade Federal de Campina Grande
Citation: ANDRADE, Igor Silveira de. Uso de processamento de linguagem natural e aprendizagem de máquina para a extração de informação em editais de licitações não-estruturados. 2022. 10f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29248
???metadata.dc.description.resumo???: A licitação é o meio adotado pela administração pública para assegurar igualdade de condições a todos que queiram realizar contratações de produtos ou serviços com o poder público. Também é papel do poder público, realizar a análise e auditoria dos documentos derivados desse processo, de forma a garantir princípios legais como isonomia, legalidade, impessoalidade, moralidade, publicidade, e probidade administrativa. Grande parte dos documentos relacionados aos processos licitatórios utilizam o formato Portable Document Format (PDF). Tal formato, não estruturado, torna a análise textual automatizada mais complexa. O presente trabalho, tem como objetivo o desenvolvimento de um modelo de indução, baseado em classiicação supervisionada, que seja capaz de identiicar informações especíicas contidas em um edital de licitação, e assim adicionar uma camada de automação ao processo de auditoria do documento. Para isso, foram utilizadas técnicas de processamento de linguagem natural, e foram analisados diferentes modelos de aprendizagem de máquina, para a seleção do melhor modelo a ser utilizado na tarefa de classiicação. A base de dados utilizada foi extraída do Portal do Governo do Estado do Acre. Ao inal da implementação, o modelo obteve bons resultados e mostrou-se capaz de identiicar as informações de interesse presentes nos documentos de maneira satisfatória.
Abstract: Bidding is the means adopted by the public administration to ensure equality of conditions for all who want to contract products or services with the government. It is also the role of the government to carry out the analysis and audit of documents derived from this process, in order to guarantee legal principles such as isonomy, legality, impersonality, morality, publicity, and administrative probity. Most documents related to bidding processes use the Portable Document Format (PDF). Such an unstructured format makes automated textual analysis more complex. The present work aims to develop an induction model, based on supervised classification, that is able to identify specific information contained in a bidding document, and thus add a layer of automation to the document audit process. For this, natural language processing techniques were used, and different machine learning models were analyzed to select the best model to be used in the classification task. The database used was extracted from the Portal of the Government of the State of Acre. At the end of the implementation, the model obtained great results and was able to identify the information of interest present in the documents in a satisfactory way.
Keywords: Aprendizagem de máquina
Linguagem natural
Processamento de linguagem natural
Licitações - editais
Editais de licitações
Machine learning
Natural language
Natural language processing
Tenders - notices
Bidding notices
???metadata.dc.subject.cnpq???: Ciência da Computação.
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29248
Appears in Collections:Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:
File Description SizeFormat 
IGOR SILVEIRA DE ANDRADE - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdfIgor Silveira de Andrade - TCC Artigo Ciência da Computação CEEI 2022.436.35 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.