dc.creator.ID |
SOARES, C. M. P. |
pt_BR |
dc.contributor.advisor1 |
GOMES, Herman Martins. |
|
dc.contributor.advisor1ID |
GOMES, H. M. |
pt_BR |
dc.contributor.advisor1Lattes |
http://lattes.cnpq.br/4223020694433271 |
pt_BR |
dc.contributor.referee1 |
MACHADO, Patrícia Duarte de Lima. |
|
dc.contributor.referee1ID |
MACHADO, P. D. L. |
pt_BR |
dc.contributor.referee1Lattes |
http://lattes.cnpq.br/2495918356675019 |
pt_BR |
dc.contributor.referee2 |
BRASILEIRO, Francisco Vilar. |
|
dc.contributor.referee2ID |
BRASILEIRO, F. V. |
pt_BR |
dc.contributor.referee2Lattes |
http://lattes.cnpq.br/5957855817378897 |
pt_BR |
dc.description.resumo |
A busca por extração de características em textos é uma área de interesse em aprendizagem de máquina
devido às inúmeras possibilidades relacionadas, dentre elas a verificação de autoria é um tema relevante
por suas aplicações e elevada complexidade. Neste contexto, o presente artigo faz uso de dados
provenientes de mensagens de chat de servidores Discord com o propósito de verificar automaticamente
a autoria das mensagens mediante um treinamento supervisionado. O processo inicia-se com um
pré-processamento que busca reduzir ruído e viés nos dados, para então explorar a capacidade do
modelo de aprendizagem em generalizar ao encontrar textos desconhecidos e defini-los como de sua
autoria ou não. Desta forma são utilizados grafos como extratores de características em mensagens de
texto, utilizando de redes neurais artificiais como modelos de aprendizagem de máquina para
classificá-las . Palavras se tornam nós, e suas arestas capturam a intensidade referente à distância dos
termos na frase, resultando na construção de um grafo que representa o vocabulário de um indivíduo e
que tem como objetivo captar características relevantes no texto.Obtidas boas acurácias para o
verdadeiros positivos e para os verdadeiros negativos ao se ajustar o limiar de ativação, os modelos
conseguem alcançar resultados satisfatórios com reduzido custo de treinamento, permitindo uma
facilidade maior para exploração de novos parâmetros. |
pt_BR |
dc.publisher.country |
Brasil |
pt_BR |
dc.publisher.department |
Centro de Engenharia Elétrica e Informática - CEEI |
pt_BR |
dc.publisher.initials |
UFCG |
pt_BR |
dc.subject.cnpq |
Ciência da Computação. |
pt_BR |
dc.title |
Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina. |
pt_BR |
dc.date.issued |
2023-06-28 |
|
dc.description.abstract |
The search for feature extraction in texts is an area of interest in machine learning due to its numerous
related possibilities, among them authorship verification is a relevant topic due to its applications and
high complexity. In this context, this article uses data from Discord server chat messages with the
purpose of automatically verifying the authorship of messages through supervised training. The process
begins with preprocessing that aims to reduce noise and bias in the data, and then explores the learning
model's ability to generalize by identifying unknown texts and classifying them as either authored or not.
Graphs are used as feature extractors in text messages, leveraging artificial neural networks as machine
learning models for classification. Words become nodes, and their edges capture the intensity related to
the distance between terms in the sentence, resulting in the construction of a graph that represents an
individual's vocabulary and aims to capture relevant characteristics in the text. By achieving good
accuracies for true positives and true negatives when adjusting the activation threshold, the models can
achieve satisfactory results with reduced training cost, allowing for easier exploration of new parameters. |
pt_BR |
dc.identifier.uri |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30514 |
|
dc.date.accessioned |
2023-07-03T12:22:23Z |
|
dc.date.available |
2023-07-03 |
|
dc.date.available |
2023-07-03T12:22:23Z |
|
dc.type |
Trabalho de Conclusão de Curso |
pt_BR |
dc.subject |
Grafos - fontes d einformação |
pt_BR |
dc.subject |
Autoria - mensagens de texto |
pt_BR |
dc.subject |
Mensagens de texto - autoria |
pt_BR |
dc.subject |
Aprendizagem de máquina |
pt_BR |
dc.subject |
Verificação de autoria - mensagens de texto |
pt_BR |
dc.subject |
Mensagens de chat - servidores Discord |
pt_BR |
dc.subject |
Medidas de distância - computação |
pt_BR |
dc.subject |
Rede neural |
pt_BR |
dc.subject |
Graphs - sources of information |
pt_BR |
dc.subject |
Authoring - text messages |
pt_BR |
dc.subject |
Text messages - authoring |
pt_BR |
dc.subject |
Machine learning |
pt_BR |
dc.subject |
Authorship verification - text messages |
pt_BR |
dc.subject |
Chat messages - Discord servers |
pt_BR |
dc.subject |
Distance measurements - computing |
pt_BR |
dc.subject |
Neural network |
pt_BR |
dc.rights |
Acesso Aberto |
pt_BR |
dc.creator |
SOARES, Caio Maxximus Pereira. |
|
dc.publisher |
Universidade Federal de Campina Grande |
pt_BR |
dc.language |
por |
pt_BR |
dc.title.alternative |
Verification of authorship in text messages using graphs and machine learning. |
pt_BR |
dc.identifier.citation |
SOARES, Caio Maxximus Pereira. Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina. 2023. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30514 |
pt_BR |