DSpace/Manakin Repository

Classificações de notícias falsas baseadas em similaridade semântica a partir de léxicos automaticamente construídos.

Mostrar registro simples

dc.creator.ID JERÔNIMO, C. L. M. pt_BR
dc.creator.Lattes http://lattes.cnpq.br/8814983860861046 pt_BR
dc.contributor.advisor1 MARINHO, Leandro Balby.
dc.contributor.advisor1ID MARINHO, L. B. pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/3728312501032061 pt_BR
dc.contributor.advisor2 CAMPELO, Cláudio Elízio Calazans.
dc.contributor.advisor2ID CAMPELO, C. E. C. pt_BR
dc.contributor.advisor2Lattes http://lattes.cnpq.br/2042247762832979 pt_BR
dc.contributor.referee1 ANDRADE, Nazareno Ferreira de.
dc.contributor.referee2 MORAIS, Fábio Jorge Almeida.
dc.contributor.referee3 SOUZA, Fabrício Benevenuto de.
dc.contributor.referee4 LIMA, Rinaldo José de.
dc.description.resumo Métodos de detecção de notícias falsas baseados unicamente em características textuais permitem uma detecção precoce deste tipo de conteúdo. Esta estratégia de detecção não necessita de informações como o número de curtidas ou quantidade de compartilhamentos, informações disponíveis apenas quando a notícia já tem se disseminado nas redes sociais. Dentro deste escopo, o uso de léxicos como recurso para auxiliar na construção de features de classificação se destaca por ser um recurso capaz de agregar um conhecimento prévio ao processo de classificação. Porém, a construção deste tipo de recurso muitas vezes exige a participação de especialistas no processo, o que em muitos contextos, torna o processo muito custoso ou mesmo inviável. Nesta pesquisa, é proposto um método para a construção automática de léxicos voltados para a análise e classificação de notícias falsas. O método proposto utiliza documentos de notícias falsas e reais, onde são extraídos termos que auxiliam na diferenciação destes dois tipos de documentos. Também é proposta, a partir dos léxicos gerados, uma estratégia para a construção de features de classificação baseados em similaridade semântica. Nesta pesquisa, avaliamos e comparamos modelos treinados a partir dos léxicos gerados automaticamente com modelos treinados utilizando léxicos já presentes na literatura. Como principais resultados, foi possível verificar que os modelos que utilizaram os léxicos construídos nesta pesquisa se mostraram superiores em diferentes cenários, como também apresentaram, de forma sistemática, melhores resultados quando utilizados em conjunto com os léxicos já existentes na literatura. Por fim, é apresentada uma análise da explicabilidade dos modelos, permitindo revelar nuances das notícias falsas que só puderam ser observadas com o auxílio dos léxicos gerados nesta pesquisa. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department Centro de Engenharia Elétrica e Informática - CEEI pt_BR
dc.publisher.program PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO pt_BR
dc.publisher.initials UFCG pt_BR
dc.subject.cnpq Ciência da Computação pt_BR
dc.title Classificações de notícias falsas baseadas em similaridade semântica a partir de léxicos automaticamente construídos. pt_BR
dc.date.issued 2022-02-07
dc.description.abstract Fake news detection methods based on textual features allow early detection of this type of content. This detection strategy does not need information such as the number of likes or the number of shares, informations only available when the news has already been dissemi nated on social networks. Within this scope, the use of lexicons as a resource to assist in the construction of classification features stands out for being a resource capable of adding prior knowledge to the classification process. However, the construction of this type of resource often requires the participation of specialists in the process, which in many contexts makes the process very costly or even unfeasible. In this research, a method for the automatic con struction of fake news lexicons is proposed. The proposed method uses false and real news documents, where terms that help to differentiate these two types of documents are extracted. It is also proposed, from the generated lexicons, a strategy for the construction of classifica tion features based on semantic similarity. In this research, we evaluate and compare models trained with the constructed lexicons and compare them with models trained with lexicons already present in literature. As main results, it was possible to verify that the models that use the generated lexicons were superior in different scenarios, as well as presenting better results when used in conjunction with the lexicons that are present in literature. Finally, an explainable analysis of the models is presented, allowing to reveal nuances of fake news that could only be observed with the help of the lexicons generated in this research. pt_BR
dc.identifier.uri http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/25060
dc.date.accessioned 2022-05-09T15:27:23Z
dc.date.available 2022-05-09
dc.date.available 2022-05-09T15:27:23Z
dc.type Tese pt_BR
dc.subject Notícias falsas pt_BR
dc.subject Similiridade semântica pt_BR
dc.subject Classificação pt_BR
dc.subject Redes sociais pt_BR
dc.subject Fake news pt_BR
dc.subject Semantic similarity pt_BR
dc.subject Classification pt_BR
dc.subject Social media pt_BR
dc.subject Noticias falsas pt_BR
dc.subject Similitud semántica pt_BR
dc.subject Clasificación pt_BR
dc.subject Redes sociales pt_BR
dc.subject Fausses nouvelles pt_BR
dc.subject Similarité sémantique pt_BR
dc.subject Classification pt_BR
dc.subject Des médias sociaux pt_BR
dc.rights Acesso Aberto pt_BR
dc.creator JERÔNIMO, Caio Libânio Melo.
dc.publisher Universidade Federal de Campina Grande pt_BR
dc.language por pt_BR
dc.title.alternative Fake news classifications based on semantic similarity from automatically constructed lexicons. pt_BR
dc.identifier.citation JERÔNIMO, C. L. M. Classificações de notícias falsas baseadas em similaridade semântica a partir de léxicos automaticamente construídos. 2022. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2022. pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta