dc.creator.ID |
AILLKEEN, B.O. |
pt_BR |
dc.creator.Lattes |
http://lattes.cnpq.br/5681431499623786 |
pt_BR |
dc.contributor.advisor1 |
BAPTISTA, Cláudio de Souza. |
|
dc.contributor.advisor1ID |
BAPTISTA, C. S. |
pt_BR |
dc.contributor.advisor1Lattes |
http://lattes.cnpq.br/0104124422364023 |
pt_BR |
dc.contributor.referee1 |
GOMES , Herman Martins. |
|
dc.contributor.referee2 |
BARBOSA, Luciano de Andrade. |
|
dc.description.resumo |
Em uma era em que as pessoas estão cada vez mais conectadas, a dispersão de discurso de
ódio em redes sociais tornou-se mais frequente. Para contornar esse problema, a tecnologia
computacional emergiu como uma ferramenta valiosa para identificar e mitigar discurso de
ódio em redes sociais. Diante do poder computacional disponível, este trabalho contempla o
uso de Processamento de Linguagem Natural para detectar discurso de ódio em textos prove nientes de redes sociais. Além de abordar a detecção, outro objetivo é investigar o impacto da
distância léxica entre os idiomas dos corpora empregados no treinamento dos modelos, ex plorando codificadores e decodificadores baseados na arquitetura de Transformers. Portanto,
realizou-se uma investigação sobre a inclusão de Cross-lingual Learning (CLL) para apri morar a detecção de discurso de ódio em diferentes idiomas, empregando diversas técnicas
de CLL, bem como a aplicação de múltiplos idiomas como fonte de treino para o mod elo. Os resultados revelaram que a aplicação de CLL, especialmente com múltiplos idiomas
fonte, melhorou significativamente a eficácia desses modelos na classificação de discurso de
ódio. Os modelos baseados em codificadores mostraram-se mais eficientes quando a dis tância léxica entre os idiomas era mais próxima, alcançando 96,92% na métrica F1-score.
Em contraste, os modelos decodificadores mostraram-se mais eficientes quando a distância
léxica entre os idiomas era mais distante, alcançando 96,58% na métrica F1-score. Sendo
assim, esta dissertação destaca que a diversidade linguística e a consideração da distância
léxica em modelos fundamentados em Transformers são cruciais para o desenvolvimento de
sistemas eficazes para detectar discurso de ódio. Por fim, os achados desta pesquisa reforçam
a viabilidade de utilizar CLL e múltiplos idiomas para aprimorar a detecção de discurso de
ódio, oferecendo novas direções e percepções para pesquisas futuras nessa área. |
pt_BR |
dc.publisher.country |
Brasil |
pt_BR |
dc.publisher.department |
Centro de Engenharia Elétrica e Informática - CEEI |
pt_BR |
dc.publisher.program |
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO |
pt_BR |
dc.publisher.initials |
UFCG |
pt_BR |
dc.subject.cnpq |
Ciência da Computação. |
pt_BR |
dc.title |
Detecção de discurso de ódio em comentários relacionados à política. |
pt_BR |
dc.date.issued |
2024-05-15 |
|
dc.description.abstract |
In an era where people are increasingly connected, the spread of hate speech on social net works has become more frequent. Consequently, computational technology has emerged as
a valuable tool to identify and mitigate hate speech on these platforms. Given the avail able computational power, we used Natural Language Processing to detect hate speech in
texts from social networks. Besides addressing detection, another goal was to investigate
the impact of lexical distance between the languages of the corpora used in model training,
exploring encoders and decoders based on Transformer architecture. Therefore, we inves tigated the inclusion of Cross-Lingual Learning (CLL) to enhance hate speech detection in
different languages, employing various CLL techniques and the application of multiple lan guages as training sources for the model. The results revealed that applying CLL, especially
with multiple source languages, significantly improved the effectiveness of the models in
classifying hate speech. Moreover, encoder-based models were more efficient when the lex ical distance between languages was closer, achieving 96.92% in the F1-score metric. In
contrast, decoder models were more efficient when the lexical distance between languages
was farther, achieving 96.58% in the F1-score metric. Thus, this work highlights that lin guistic diversity and the lexical distance used in Transformer-based models are crucial for
developing effective systems to detect hate speech. Finally, the findings of this research rein force the feasibility of using CLL and multiple languages to improve hate speech detection,
offering new directions and insights for future research in this area. |
pt_BR |
dc.identifier.uri |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/36976 |
|
dc.date.accessioned |
2024-07-31T19:14:42Z |
|
dc.date.available |
2024-07-31 |
|
dc.date.available |
2024-07-31T19:14:42Z |
|
dc.type |
Dissertação |
pt_BR |
dc.subject |
Processamento de linguagem natural |
pt_BR |
dc.subject |
Detecção de discurso de ódio |
pt_BR |
dc.subject |
Cross-lingual learning |
pt_BR |
dc.subject |
Redes sociais |
pt_BR |
dc.subject |
Natural Language Processing |
pt_BR |
dc.subject |
Hate speech detection |
pt_BR |
dc.subject |
Social media |
pt_BR |
dc.rights |
Acesso Aberto |
pt_BR |
dc.creator |
OLIVEIRA, Aillkeen Bezerra de. |
|
dc.publisher |
Universidade Federal de Campina Grande |
pt_BR |
dc.language |
por |
pt_BR |
dc.title.alternative |
Detecting hate speech in politics-related comments. |
pt_BR |
dc.identifier.citation |
OLIVEIRA, Aillkeen Bezerra de. Detecção de discurso de ódio em comentários relacionados à política. 2024. 142 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024. |
pt_BR |