Detecção de Discurso de Ódio em Comentários Relacionados à Política

Página inicial
→
Campus Campina Grande | Centro de Engenharia Elétrica e Informática - CEEI
→
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
→
Mestrado em Ciência da Computação.
→
Ver item

dc.creator.ID	AILLKEEN, B.O	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/5681431499623786	pt_BR
dc.contributor.advisor1	BAPTISTA, Cláudio de Souza.
dc.contributor.advisor1ID	BAPTISTA, C. S.	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/0104124422364023	pt_BR
dc.contributor.referee1	GOMES, Herman Martins.
dc.contributor.referee2	BARBOSA, Luciano de Andrade.
dc.description.resumo	Em uma era em que as pessoas estão cada vez mais conectadas, a dispersão de discurso de ódio em redes sociais tornou-se mais frequente. Para contornar esse problema, a tecnologia computacional emergiu como uma ferramenta valiosa para identificar e mitigar discurso de ódio em redes sociais. Diante do poder computacional disponível, este trabalho contempla o uso de Processamento de Linguagem Natural para detectar discurso de ódio em textos provenientes de redes sociais. Além de abordar a detecção, outro objetivo é investigar o impacto da distância léxica entre os idiomas dos corpora empregados no treinamento dos modelos, explorando codificadores e decodificadores baseados na arquitetura de Transformers. Portanto, realizou-se uma investigação sobre a inclusão de Cross-lingual Learning (CLL) para aprimorar a detecção de discurso de ódio em diferentes idiomas, empregando diversas técnicas de CLL, bem como a aplicação de múltiplos idiomas como fonte de treino para o modelo. Os resultados revelaram que a aplicação de CLL, especialmente com múltiplos idiomas fonte, melhorou significativamente a eficácia desses modelos na classificação de discurso de ódio. Os modelos baseados em codificadores mostraram-se mais eficientes quando a distância léxica entre os idiomas era mais próxima, alcançando 96,92% na métrica F1-score. Em contraste, os modelos decodificadores mostraram-se mais eficientes quando a distância léxica entre os idiomas era mais distante, alcançando 96,58% na métrica F1-score. Sendo assim, esta dissertação destaca que a diversidade linguística e a consideração da distância léxica em modelos fundamentados em Transformers são cruciais para o desenvolvimento de sistemas eficazes para detectar discurso de ódio. Por fim, os achados desta pesquisa reforçam a viabilidade de utilizar CLL e múltiplos idiomas para aprimorar a detecção de discurso de ódio, oferecendo novas direções e percepções para pesquisas futuras nessa área.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Centro de Engenharia Elétrica e Informática - CEEI	pt_BR
dc.publisher.program	PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO	pt_BR
dc.publisher.initials	UFCG	pt_BR
dc.subject.cnpq	Ciência da Computação	pt_BR
dc.title	Detecção de Discurso de Ódio em Comentários Relacionados à Política	pt_BR
dc.date.issued	2024-05-10
dc.description.abstract	In an era where people are increasingly connected, the spread of hate speech on social networks has become more frequent. Consequently, computational technology has emerged as a valuable tool to identify and mitigate hate speech on these platforms. Given the available computational power, we used Natural Language Processing to detect hate speech in texts from social networks. Besides addressing detection, another goal was to investigate the impact of lexical distance between the languages of the corpora used in model training, exploring encoders and decoders based on Transformer architecture. Therefore, we investigated the inclusion of Cross-Lingual Learning (CLL) to enhance hate speech detection in different languages, employing various CLL techniques and the application of multiple languages as training sources for the model. The results revealed that applying CLL, especially with multiple source languages, significantly improved the effectiveness of the models in classifying hate speech. Moreover, encoder-based models were more efficient when the lexical distance between languages was closer, achieving 96.92% in the F1-score metric. In contrast, decoder models were more efficient when the lexical distance between languages was farther, achieving 96.58% in the F1-score metric. Thus, this work highlights that linguistic diversity and the lexical distance used in Transformer-based models are crucial for developing effective systems to detect hate speech. Finally, the findings of this research reinforce the feasibility of using CLL and multiple languages to improve hate speech detection, offering new directions and insights for future research in this area.	pt_BR
dc.identifier.uri	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/36652
dc.date.accessioned	2024-07-16T13:43:45Z
dc.date.available	2024-07-16
dc.date.available	2024-07-16T13:43:45Z
dc.type	Dissertação	pt_BR
dc.subject	Redes Sociais	pt_BR
dc.subject	Cross-Lingual Learning	pt_BR
dc.subject	Detecção de Discurso de Ódio	pt_BR
dc.subject	Processamento de Linguagem Natural	pt_BR
dc.subject	Social Media	pt_BR
dc.subject	Cross-Lingual Learning	pt_BR
dc.subject	Speech Detection of Hate	pt_BR
dc.subject	Natural Language Processing	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.creator	OLIVEIRA, Aillkeen Bezerra de.
dc.publisher	Universidade Federal de Campina Grande	pt_BR
dc.language	por	pt_BR
dc.title.alternative	Detection of Hate Speech in Comments Policy-related	pt_BR
dc.identifier.citation	OLIVEIRA, Aillkeen Bezerra de. Detecção de discurso de ódio em comentários relacionados à política. 2024. 142 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024.	pt_BR