DSpace/Manakin Repository

Utilizando técnicas de aprendizagem de máquina e NLP para extração de informações em licitações do Diário Oficial do Estado do Acre.

Mostrar registro simples

dc.creator.ID RAMALHO, R. E. C. pt_BR
dc.creator.Lattes http://lattes.cnpq.br/7686727918516258 pt_BR
dc.contributor.advisor1 BAPTISTA, Cláudio de Souza.
dc.contributor.advisor1ID BAPTISTA, C. S. pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/0104124422364023 pt_BR
dc.contributor.advisor2 FIGUEIRÊDO, Hugo Feitosa de.
dc.contributor.advisor2ID FIGUEIRÊDO, H. F. pt_BR
dc.contributor.advisor2Lattes http://lattes.cnpq.br/9466135849011391 pt_BR
dc.contributor.referee1 OLIVEIRA, Maswell Guimarães de.
dc.contributor.referee1ID OLIVEIRA, M. G. pt_BR
dc.contributor.referee2 BRASILEIRO, Francisco Vilar.
dc.contributor.referee2ID BRASILEIRO, F. V. pt_BR
dc.description.resumo Sistemas de Extração de Informação auxiliam humanos na busca de informação específica em documentos. No entanto, a maioria destes sistemas não dão suporte a documentos no formato Portable Document Format (PDF), que é largamente utilizado. Em um documento PDF, o conteúdo do texto é misturado com metadados ou dados semi-estruturados, que dificultam os algoritmos de Processamento de Linguagem Natural (PLN) na extração da informação requerida. O Tribunal de Contas do Estado do Acre (TCE-AC) é o órgão fiscalizador e controlador do uso do dinheiro público e da administração orçamentária e financeira do estado do Acre, responsável por analisar e julgar as contas públicas dos jurisdicionados. Os jurisdicionados devem publicar informações relacionadas às licitações tanto no sistema de gerenciamento de licitações do TCE-AC como também no Diário Oficial do Estado do Acre (DOE), que usa o formato PDF. É de responsabilidade do TCE-AC verificar se as informações da licitação estão nos dois lugares, gerando assim, um grande trabalho manual. Neste trabalho, apresentamos uma solução de PLN com objetivo de extrair os atos do DOE, categorizar automaticamente os atos como licitação ou não, em caso afirmativo, serão utilizadas técnicas avançadas de PLN para processar e extrair as entidades e informações da licitação para que seja possível auxiliar o TCE-AC a verificar se a licitação pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department Centro de Engenharia Elétrica e Informática - CEEI pt_BR
dc.publisher.initials UFCG pt_BR
dc.subject.cnpq Ciência da Computação. pt_BR
dc.title Utilizando técnicas de aprendizagem de máquina e NLP para extração de informações em licitações do Diário Oficial do Estado do Acre. pt_BR
dc.date.issued 2022-09-02
dc.description.abstract Information Extraction Systems assist humans in searching for specific information in documents. However, most of these systems do not support documents in the Portable Document Format (PDF), which is widely used. In a PDF document, the text content is mixed with metadata or semi-structured data, which makes it difficult for Natural Language Processing (NLP) algorithms to extract the required information. The Court of Auditors of the State of Acre (TCE-AC) is the supervisory and controlling body of the use of public money and the budget and financial administration of the state of Acre, responsible for analyzing and judging the public accounts of the jurisdictions. Jurisdictions must publish information related to bids both in the TCE-AC bid management system and in the Official Gazette of the State of Acre (DOE), which uses the PDF format. It is the responsibility of the TCE-AC to verify that the bidding information is in both places, thus generating a lot of manual work. In this work, we present a PLN solution with the objective of extracting the DOE acts, automatically categorizing the acts as bidding or not, if so, advanced PLN techniques will be used to process and extract the entities and information from the bidding so that it is possible assist the TCE-AC to verify that the bid is also in the bid management system. pt_BR
dc.identifier.uri http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29273
dc.date.accessioned 2023-04-05T17:43:06Z
dc.date.available 2023-04-05
dc.date.available 2023-04-05T17:43:06Z
dc.type Trabalho de Conclusão de Curso pt_BR
dc.subject Aprendizagem de máquina pt_BR
dc.subject Extração de informações pt_BR
dc.subject Diário Oficial do Estado do Acre - Licitações pt_BR
dc.subject Licitações - Diário Oficial do Estado do Acre pt_BR
dc.subject Processamento de linguagem natural pt_BR
dc.subject Tribunal de Contas do Estado do Acre - TCE-AC pt_BR
dc.subject Extração de dados pt_BR
dc.subject Machine learning pt_BR
dc.subject Information extraction pt_BR
dc.subject Official Gazette of the State of Acre - Bids pt_BR
dc.subject Bids - Official Gazette of the State of Acre pt_BR
dc.subject Natural language processing pt_BR
dc.subject Court of Auditors of the State of Acre - TCE-AC pt_BR
dc.subject Data extraction pt_BR
dc.rights Acesso Aberto pt_BR
dc.creator RAMALHO, Rich Elton Carvalho.
dc.publisher Universidade Federal de Campina Grande pt_BR
dc.language por pt_BR
dc.title.alternative Using machine learning and NLP techniques to extract information on bids from the Official Gazette of the State of Acre. pt_BR
dc.identifier.citation RAMALHO, Rich Elton Carvalho. Utilizando técnicas de aprendizagem de máquina e NLP para extração de informações em licitações do Diário Oficial do Estado do Acre. 2022. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29273 pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta