Classificações de notícias falsas baseadas em similaridade semântica a partir de léxicos automaticamente construídos.

Página inicial
→
Campus Campina Grande | Centro de Engenharia Elétrica e Informática - CEEI
→
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
→
Doutorado em Ciência da Computação.
→
Ver item

dc.creator.ID	JERÔNIMO, C. L. M.	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/8814983860861046	pt_BR
dc.contributor.advisor1	MARINHO, Leandro Balby.
dc.contributor.advisor1ID	MARINHO, L. B.	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/3728312501032061	pt_BR
dc.contributor.advisor2	CAMPELO, Cláudio Elízio Calazans.
dc.contributor.advisor2ID	CAMPELO, C. E. C.	pt_BR
dc.contributor.advisor2Lattes	http://lattes.cnpq.br/2042247762832979	pt_BR
dc.contributor.referee1	ANDRADE, Nazareno Ferreira de.
dc.contributor.referee2	MORAIS, Fábio Jorge Almeida.
dc.contributor.referee3	SOUZA, Fabrício Benevenuto de.
dc.contributor.referee4	LIMA, Rinaldo José de.
dc.description.resumo	Métodos de detecção de notícias falsas baseados unicamente em características textuais permitem uma detecção precoce deste tipo de conteúdo. Esta estratégia de detecção não necessita de informações como o número de curtidas ou quantidade de compartilhamentos, informações disponíveis apenas quando a notícia já tem se disseminado nas redes sociais. Dentro deste escopo, o uso de léxicos como recurso para auxiliar na construção de features de classificação se destaca por ser um recurso capaz de agregar um conhecimento prévio ao processo de classificação. Porém, a construção deste tipo de recurso muitas vezes exige a participação de especialistas no processo, o que em muitos contextos, torna o processo muito custoso ou mesmo inviável. Nesta pesquisa, é proposto um método para a construção automática de léxicos voltados para a análise e classificação de notícias falsas. O método proposto utiliza documentos de notícias falsas e reais, onde são extraídos termos que auxiliam na diferenciação destes dois tipos de documentos. Também é proposta, a partir dos léxicos gerados, uma estratégia para a construção de features de classificação baseados em similaridade semântica. Nesta pesquisa, avaliamos e comparamos modelos treinados a partir dos léxicos gerados automaticamente com modelos treinados utilizando léxicos já presentes na literatura. Como principais resultados, foi possível verificar que os modelos que utilizaram os léxicos construídos nesta pesquisa se mostraram superiores em diferentes cenários, como também apresentaram, de forma sistemática, melhores resultados quando utilizados em conjunto com os léxicos já existentes na literatura. Por fim, é apresentada uma análise da explicabilidade dos modelos, permitindo revelar nuances das notícias falsas que só puderam ser observadas com o auxílio dos léxicos gerados nesta pesquisa.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Centro de Engenharia Elétrica e Informática - CEEI	pt_BR
dc.publisher.program	PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO	pt_BR
dc.publisher.initials	UFCG	pt_BR
dc.subject.cnpq	Ciência da Computação	pt_BR
dc.title	Classificações de notícias falsas baseadas em similaridade semântica a partir de léxicos automaticamente construídos.	pt_BR
dc.date.issued	2022-02-07
dc.description.abstract	Fake news detection methods based on textual features allow early detection of this type of content. This detection strategy does not need information such as the number of likes or the number of shares, informations only available when the news has already been dissemi nated on social networks. Within this scope, the use of lexicons as a resource to assist in the construction of classification features stands out for being a resource capable of adding prior knowledge to the classification process. However, the construction of this type of resource often requires the participation of specialists in the process, which in many contexts makes the process very costly or even unfeasible. In this research, a method for the automatic con struction of fake news lexicons is proposed. The proposed method uses false and real news documents, where terms that help to differentiate these two types of documents are extracted. It is also proposed, from the generated lexicons, a strategy for the construction of classifica tion features based on semantic similarity. In this research, we evaluate and compare models trained with the constructed lexicons and compare them with models trained with lexicons already present in literature. As main results, it was possible to verify that the models that use the generated lexicons were superior in different scenarios, as well as presenting better results when used in conjunction with the lexicons that are present in literature. Finally, an explainable analysis of the models is presented, allowing to reveal nuances of fake news that could only be observed with the help of the lexicons generated in this research.	pt_BR
dc.identifier.uri	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/25060
dc.date.accessioned	2022-05-09T15:27:23Z
dc.date.available	2022-05-09
dc.date.available	2022-05-09T15:27:23Z
dc.type	Tese	pt_BR
dc.subject	Notícias falsas	pt_BR
dc.subject	Similiridade semântica	pt_BR
dc.subject	Classificação	pt_BR
dc.subject	Redes sociais	pt_BR
dc.subject	Fake news	pt_BR
dc.subject	Semantic similarity	pt_BR
dc.subject	Classification	pt_BR
dc.subject	Social media	pt_BR
dc.subject	Noticias falsas	pt_BR
dc.subject	Similitud semántica	pt_BR
dc.subject	Clasificación	pt_BR
dc.subject	Redes sociales	pt_BR
dc.subject	Fausses nouvelles	pt_BR
dc.subject	Similarité sémantique	pt_BR
dc.subject	Classification	pt_BR
dc.subject	Des médias sociaux	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.creator	JERÔNIMO, Caio Libânio Melo.
dc.publisher	Universidade Federal de Campina Grande	pt_BR
dc.language	por	pt_BR
dc.title.alternative	Fake news classifications based on semantic similarity from automatically constructed lexicons.	pt_BR
dc.identifier.citation	JERÔNIMO, C. L. M. Classificações de notícias falsas baseadas em similaridade semântica a partir de léxicos automaticamente construídos. 2022. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2022.	pt_BR