Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37843
Title: Monitoração da sanidade de web scrapers com OpenTelemetry.
Other Titles: Monitoring the health of web scrapers with OpenTelemetry.
???metadata.dc.creator???: MARTINS, André Lucas Medeiros.
???metadata.dc.contributor.advisor1???: ARAÚJO, Eliane Cristina de.
???metadata.dc.contributor.referee1???: GUERRERO, Dalton Dario Serey.
???metadata.dc.contributor.referee2???: BRASILEIRO, Francisco Vilar.
Keywords: Monitoramento da Sanidade - Web Scraper;Web Scraper;OpenTelemetry;Health Monitoring - Web Scraper
Issue Date: 15-May-2024
Publisher: Universidade Federal de Campina Grande
Citation: MARTINS, André Lucas Medeiros. Monitoração da sanidade de web scrapers com OpenTelemetry. 2024. 9 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2024.
???metadata.dc.description.resumo???: Web Scrapers são ferramentas para coletar dados de sites web sendo uma estratégia amplamente usada para fornecer diversos tipos de serviços. No entanto, quando se tem um ou mais serviços de extração de dados de sites, como saber a “saúde” desse funcionamento? Não existe um compromisso de compatibilidade entre site e scraper, pois, em geral, são desenvolvidos por equipes diferentes. Dessa forma, o scraper pode inadvertidamente deixar de funcionar devido a mudanças realizadas no site. Neste trabalho foi desenvolvida uma estratégia usando OpenTemeletry, para emissão de métricas e rastreamentos de funcionamento para solucionar esta falta de visão da sanidade do scraper. Espera-se que ao final deste trabalho seja possível aplicar a solução na prática e, assim, ter um único local com as informações de funcionamento dos Web Scrapers.
Abstract: Web Scrapers are tools for collecting data from websites, widely used to provide various types of services. However, when you have one or more data extraction services from websites, how do you know the "health" of their operation? There is no compatibility commitment between the site and the scraper because they are generally developed by different teams. Thus, the scraper may inadvertently fail to function due to changes made to the site. In this work, a strategy using OpenTelemetry was developed to emit metrics and operational traces to address this lack of insight into the scraper's health. It is expected that by the end of this work, it will be possible to apply the solution in practice and thus have a single location with information on the operation of Web Scrapers.
Keywords: Monitoramento da Sanidade - Web Scraper
Web Scraper
OpenTelemetry
Health Monitoring - Web Scraper
???metadata.dc.subject.cnpq???: Ciência da Computação
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37843
Appears in Collections:Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:
File Description SizeFormat 
ANDRE LUCAS MEDEIROS MARTINS - TCC CIÊNCIA DA COMPUTAÇÃO 2024-otimizado_1.pdf873.47 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.