Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.

Página inicial
→
Campus Campina Grande | Centro de Engenharia Elétrica e Informática - CEEI
→
CURSOS DE GRADUAÇÃO DO CEEI
→
Curso de Bacharelado em Ciência da Computação
→
Trabalho de Conclusão de Curso - Artigo - Ciência da Computação
→
Ver item

dc.creator.ID	SOARES, C. M. P.	pt_BR
dc.contributor.advisor1	GOMES, Herman Martins.
dc.contributor.advisor1ID	GOMES, H. M.	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/4223020694433271	pt_BR
dc.contributor.referee1	MACHADO, Patrícia Duarte de Lima.
dc.contributor.referee1ID	MACHADO, P. D. L.	pt_BR
dc.contributor.referee1Lattes	http://lattes.cnpq.br/2495918356675019	pt_BR
dc.contributor.referee2	BRASILEIRO, Francisco Vilar.
dc.contributor.referee2ID	BRASILEIRO, F. V.	pt_BR
dc.contributor.referee2Lattes	http://lattes.cnpq.br/5957855817378897	pt_BR
dc.description.resumo	A busca por extração de características em textos é uma área de interesse em aprendizagem de máquina devido às inúmeras possibilidades relacionadas, dentre elas a verificação de autoria é um tema relevante por suas aplicações e elevada complexidade. Neste contexto, o presente artigo faz uso de dados provenientes de mensagens de chat de servidores Discord com o propósito de verificar automaticamente a autoria das mensagens mediante um treinamento supervisionado. O processo inicia-se com um pré-processamento que busca reduzir ruído e viés nos dados, para então explorar a capacidade do modelo de aprendizagem em generalizar ao encontrar textos desconhecidos e defini-los como de sua autoria ou não. Desta forma são utilizados grafos como extratores de características em mensagens de texto, utilizando de redes neurais artificiais como modelos de aprendizagem de máquina para classificá-las . Palavras se tornam nós, e suas arestas capturam a intensidade referente à distância dos termos na frase, resultando na construção de um grafo que representa o vocabulário de um indivíduo e que tem como objetivo captar características relevantes no texto.Obtidas boas acurácias para o verdadeiros positivos e para os verdadeiros negativos ao se ajustar o limiar de ativação, os modelos conseguem alcançar resultados satisfatórios com reduzido custo de treinamento, permitindo uma facilidade maior para exploração de novos parâmetros.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Centro de Engenharia Elétrica e Informática - CEEI	pt_BR
dc.publisher.initials	UFCG	pt_BR
dc.subject.cnpq	Ciência da Computação.	pt_BR
dc.title	Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.	pt_BR
dc.date.issued	2023-06-28
dc.description.abstract	The search for feature extraction in texts is an area of interest in machine learning due to its numerous related possibilities, among them authorship verification is a relevant topic due to its applications and high complexity. In this context, this article uses data from Discord server chat messages with the purpose of automatically verifying the authorship of messages through supervised training. The process begins with preprocessing that aims to reduce noise and bias in the data, and then explores the learning model's ability to generalize by identifying unknown texts and classifying them as either authored or not. Graphs are used as feature extractors in text messages, leveraging artificial neural networks as machine learning models for classification. Words become nodes, and their edges capture the intensity related to the distance between terms in the sentence, resulting in the construction of a graph that represents an individual's vocabulary and aims to capture relevant characteristics in the text. By achieving good accuracies for true positives and true negatives when adjusting the activation threshold, the models can achieve satisfactory results with reduced training cost, allowing for easier exploration of new parameters.	pt_BR
dc.identifier.uri	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30514
dc.date.accessioned	2023-07-03T12:22:23Z
dc.date.available	2023-07-03
dc.date.available	2023-07-03T12:22:23Z
dc.type	Trabalho de Conclusão de Curso	pt_BR
dc.subject	Grafos - fontes d einformação	pt_BR
dc.subject	Autoria - mensagens de texto	pt_BR
dc.subject	Mensagens de texto - autoria	pt_BR
dc.subject	Aprendizagem de máquina	pt_BR
dc.subject	Verificação de autoria - mensagens de texto	pt_BR
dc.subject	Mensagens de chat - servidores Discord	pt_BR
dc.subject	Medidas de distância - computação	pt_BR
dc.subject	Rede neural	pt_BR
dc.subject	Graphs - sources of information	pt_BR
dc.subject	Authoring - text messages	pt_BR
dc.subject	Text messages - authoring	pt_BR
dc.subject	Machine learning	pt_BR
dc.subject	Authorship verification - text messages	pt_BR
dc.subject	Chat messages - Discord servers	pt_BR
dc.subject	Distance measurements - computing	pt_BR
dc.subject	Neural network	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.creator	SOARES, Caio Maxximus Pereira.
dc.publisher	Universidade Federal de Campina Grande	pt_BR
dc.language	por	pt_BR
dc.title.alternative	Verification of authorship in text messages using graphs and machine learning.	pt_BR
dc.identifier.citation	SOARES, Caio Maxximus Pereira. Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina. 2023. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30514	pt_BR