Classificações de notícias falsas baseadas em similaridade semântica a partir de léxicos automaticamente construídos.

Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/25060

Title:	Classificações de notícias falsas baseadas em similaridade semântica a partir de léxicos automaticamente construídos.
Other Titles:	Fake news classifications based on semantic similarity from automatically constructed lexicons.
???metadata.dc.creator???:	JERÔNIMO, Caio Libânio Melo.
???metadata.dc.contributor.advisor1???:	MARINHO, Leandro Balby.
???metadata.dc.contributor.advisor2???:	CAMPELO, Cláudio Elízio Calazans.
???metadata.dc.contributor.referee1???:	ANDRADE, Nazareno Ferreira de.
???metadata.dc.contributor.referee2???:	MORAIS, Fábio Jorge Almeida.
???metadata.dc.contributor.referee3???:	SOUZA, Fabrício Benevenuto de.
???metadata.dc.contributor.referee4???:	LIMA, Rinaldo José de.
Keywords:	Notícias falsas;Similiridade semântica;Classificação;Redes sociais;Fake news;Semantic similarity;Classification;Social media;Noticias falsas;Similitud semántica;Clasificación;Redes sociales;Fausses nouvelles;Similarité sémantique;Classification;Des médias sociaux
Issue Date:	7-Feb-2022
Publisher:	Universidade Federal de Campina Grande
Citation:	JERÔNIMO, C. L. M. Classificações de notícias falsas baseadas em similaridade semântica a partir de léxicos automaticamente construídos. 2022. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2022.
???metadata.dc.description.resumo???:	Métodos de detecção de notícias falsas baseados unicamente em características textuais permitem uma detecção precoce deste tipo de conteúdo. Esta estratégia de detecção não necessita de informações como o número de curtidas ou quantidade de compartilhamentos, informações disponíveis apenas quando a notícia já tem se disseminado nas redes sociais. Dentro deste escopo, o uso de léxicos como recurso para auxiliar na construção de features de classificação se destaca por ser um recurso capaz de agregar um conhecimento prévio ao processo de classificação. Porém, a construção deste tipo de recurso muitas vezes exige a participação de especialistas no processo, o que em muitos contextos, torna o processo muito custoso ou mesmo inviável. Nesta pesquisa, é proposto um método para a construção automática de léxicos voltados para a análise e classificação de notícias falsas. O método proposto utiliza documentos de notícias falsas e reais, onde são extraídos termos que auxiliam na diferenciação destes dois tipos de documentos. Também é proposta, a partir dos léxicos gerados, uma estratégia para a construção de features de classificação baseados em similaridade semântica. Nesta pesquisa, avaliamos e comparamos modelos treinados a partir dos léxicos gerados automaticamente com modelos treinados utilizando léxicos já presentes na literatura. Como principais resultados, foi possível verificar que os modelos que utilizaram os léxicos construídos nesta pesquisa se mostraram superiores em diferentes cenários, como também apresentaram, de forma sistemática, melhores resultados quando utilizados em conjunto com os léxicos já existentes na literatura. Por fim, é apresentada uma análise da explicabilidade dos modelos, permitindo revelar nuances das notícias falsas que só puderam ser observadas com o auxílio dos léxicos gerados nesta pesquisa.
Abstract:	Fake news detection methods based on textual features allow early detection of this type of content. This detection strategy does not need information such as the number of likes or the number of shares, informations only available when the news has already been dissemi nated on social networks. Within this scope, the use of lexicons as a resource to assist in the construction of classification features stands out for being a resource capable of adding prior knowledge to the classification process. However, the construction of this type of resource often requires the participation of specialists in the process, which in many contexts makes the process very costly or even unfeasible. In this research, a method for the automatic con struction of fake news lexicons is proposed. The proposed method uses false and real news documents, where terms that help to differentiate these two types of documents are extracted. It is also proposed, from the generated lexicons, a strategy for the construction of classifica tion features based on semantic similarity. In this research, we evaluate and compare models trained with the constructed lexicons and compare them with models trained with lexicons already present in literature. As main results, it was possible to verify that the models that use the generated lexicons were superior in different scenarios, as well as presenting better results when used in conjunction with the lexicons that are present in literature. Finally, an explainable analysis of the models is presented, allowing to reveal nuances of fake news that could only be observed with the help of the lexicons generated in this research.
Keywords:	Notícias falsas Similiridade semântica Classificação Redes sociais Fake news Semantic similarity Classification Social media Noticias falsas Similitud semántica Clasificación Redes sociales Fausses nouvelles Similarité sémantique Classification Des médias sociaux
???metadata.dc.subject.cnpq???:	Ciência da Computação
URI:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/25060
Appears in Collections:	Doutorado em Ciência da Computação.

Files in This Item:

File	Description	Size	Format
CAIO LIBÂNIO MELO JERÔNIMO – TESE (PPGCC) 2022.pdf		3.16 MB	Adobe PDF	View/Open

Show full item record