dc.creator.ID |
RAMALHO, R. E. C. |
pt_BR |
dc.creator.Lattes |
http://lattes.cnpq.br/7686727918516258 |
pt_BR |
dc.contributor.advisor1 |
BAPTISTA, Cláudio de Souza. |
|
dc.contributor.advisor1ID |
BAPTISTA, C. S. |
pt_BR |
dc.contributor.advisor1Lattes |
http://lattes.cnpq.br/0104124422364023 |
pt_BR |
dc.contributor.advisor2 |
FIGUEIRÊDO, Hugo Feitosa de. |
|
dc.contributor.advisor2ID |
FIGUEIRÊDO, H. F. |
pt_BR |
dc.contributor.advisor2Lattes |
http://lattes.cnpq.br/9466135849011391 |
pt_BR |
dc.contributor.referee1 |
OLIVEIRA, Maswell Guimarães de. |
|
dc.contributor.referee1ID |
OLIVEIRA, M. G. |
pt_BR |
dc.contributor.referee2 |
BRASILEIRO, Francisco Vilar. |
|
dc.contributor.referee2ID |
BRASILEIRO, F. V. |
pt_BR |
dc.description.resumo |
Sistemas de Extração de Informação auxiliam humanos na busca
de informação específica em documentos. No entanto, a maioria
destes sistemas não dão suporte a documentos no formato Portable
Document Format (PDF), que é largamente utilizado. Em um documento
PDF, o conteúdo do texto é misturado com metadados ou
dados semi-estruturados, que dificultam os algoritmos de Processamento
de Linguagem Natural (PLN) na extração da informação
requerida. O Tribunal de Contas do Estado do Acre (TCE-AC) é o
órgão fiscalizador e controlador do uso do dinheiro público e da
administração orçamentária e financeira do estado do Acre, responsável
por analisar e julgar as contas públicas dos jurisdicionados.
Os jurisdicionados devem publicar informações relacionadas às licitações
tanto no sistema de gerenciamento de licitações do TCE-AC
como também no Diário Oficial do Estado do Acre (DOE), que usa
o formato PDF. É de responsabilidade do TCE-AC verificar se as
informações da licitação estão nos dois lugares, gerando assim, um
grande trabalho manual. Neste trabalho, apresentamos uma solução
de PLN com objetivo de extrair os atos do DOE, categorizar automaticamente
os atos como licitação ou não, em caso afirmativo, serão
utilizadas técnicas avançadas de PLN para processar e extrair as
entidades e informações da licitação para que seja possível auxiliar
o TCE-AC a verificar se a licitação |
pt_BR |
dc.publisher.country |
Brasil |
pt_BR |
dc.publisher.department |
Centro de Engenharia Elétrica e Informática - CEEI |
pt_BR |
dc.publisher.initials |
UFCG |
pt_BR |
dc.subject.cnpq |
Ciência da Computação. |
pt_BR |
dc.title |
Utilizando técnicas de aprendizagem de máquina e NLP para extração de informações em licitações do Diário Oficial do Estado do Acre. |
pt_BR |
dc.date.issued |
2022-09-02 |
|
dc.description.abstract |
Information Extraction Systems assist humans in searching for specific information in documents.
However, most of these systems do not support documents in the Portable Document Format (PDF),
which is widely used. In a PDF document, the text content is mixed with metadata or semi-structured
data, which makes it difficult for Natural Language Processing (NLP) algorithms to extract the required
information. The Court of Auditors of the State of Acre (TCE-AC) is the supervisory and controlling
body of the use of public money and the budget and financial administration of the state of Acre,
responsible for analyzing and judging the public accounts of the jurisdictions. Jurisdictions must
publish information related to bids both in the TCE-AC bid management system and in the Official
Gazette of the State of Acre (DOE), which uses the PDF format. It is the responsibility of the TCE-AC to
verify that the bidding information is in both places, thus generating a lot of manual work. In this
work, we present a PLN solution with the objective of extracting the DOE acts, automatically
categorizing the acts as bidding or not, if so, advanced PLN techniques will be used to process and
extract the entities and information from the bidding so that it is possible assist the TCE-AC to verify
that the bid is also in the bid management system. |
pt_BR |
dc.identifier.uri |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29273 |
|
dc.date.accessioned |
2023-04-05T17:43:06Z |
|
dc.date.available |
2023-04-05 |
|
dc.date.available |
2023-04-05T17:43:06Z |
|
dc.type |
Trabalho de Conclusão de Curso |
pt_BR |
dc.subject |
Aprendizagem de máquina |
pt_BR |
dc.subject |
Extração de informações |
pt_BR |
dc.subject |
Diário Oficial do Estado do Acre - Licitações |
pt_BR |
dc.subject |
Licitações - Diário Oficial do Estado do Acre |
pt_BR |
dc.subject |
Processamento de linguagem natural |
pt_BR |
dc.subject |
Tribunal de Contas do Estado do Acre - TCE-AC |
pt_BR |
dc.subject |
Extração de dados |
pt_BR |
dc.subject |
Machine learning |
pt_BR |
dc.subject |
Information extraction |
pt_BR |
dc.subject |
Official Gazette of the State of Acre - Bids |
pt_BR |
dc.subject |
Bids - Official Gazette of the State of Acre |
pt_BR |
dc.subject |
Natural language processing |
pt_BR |
dc.subject |
Court of Auditors of the State of Acre - TCE-AC |
pt_BR |
dc.subject |
Data extraction |
pt_BR |
dc.rights |
Acesso Aberto |
pt_BR |
dc.creator |
RAMALHO, Rich Elton Carvalho. |
|
dc.publisher |
Universidade Federal de Campina Grande |
pt_BR |
dc.language |
por |
pt_BR |
dc.title.alternative |
Using machine learning and NLP techniques to extract information on bids from the Official Gazette of the State of Acre. |
pt_BR |
dc.identifier.citation |
RAMALHO, Rich Elton Carvalho. Utilizando técnicas de aprendizagem de máquina e NLP para extração de informações em licitações do Diário Oficial do Estado do Acre. 2022. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29273 |
pt_BR |