dc.creator.ID |
BARBOSA, B. K. S. |
pt_BR |
dc.creator.Lattes |
http://lattes.cnpq.br/8007703579388553 |
pt_BR |
dc.contributor.advisor1 |
CAMPELO, Cláudio Elízio Calazans. |
|
dc.contributor.advisor1ID |
CAMPELO, CLAUDIO E. C. |
pt_BR |
dc.contributor.advisor1Lattes |
http://lattes.cnpq.br/8007703579388553 |
pt_BR |
dc.contributor.referee1 |
MARINHO, Leandro Balby. |
|
dc.contributor.referee2 |
SANTOS E SOUZA, Marlo Vieira dos Santos. |
|
dc.description.resumo |
A coerência textual é fundamental para a compreensão eĄcaz, determinando a clareza, a
compreensibilidade e a qualidade geral do conteúdo. Modelos de Linguagem de Larga
Escala (LLMs) recentes, treinados em corpora extensivos, têm demonstrado capacidades
impressionantes em produzir textos coerentes e contextualmente relevantes, aumentando seu
potencial para tarefas de análise textual. No entanto, a habilidade desses modelos em realizar
a análise de coerência em diversos textos de entrada ainda está sob investigação. Neste
estudo, avaliamos o desempenho de modelos de linguagem avançados na análise automática
de coerência textual. Os modelos avaliados incluem GPT-4o, GPT-3.5, GPT-4, Claude Opus,
Claude 3 Sonet, Claude 3 Haiku, Bard, LLaMA 2 13b e LLaMA 2 7b. Nossa pesquisa investigou
a capacidade desses modelos em avaliar a coerência textual em diferentes níveis. Primeiro,
focamos na coerência local, que se refere à consistência lógica e contextual entre sentenças
adjacentes ou pequenos segmentos de texto. Nossos resultados indicam que GPT-4o, Claude
Opus e Gemini se destacam nessa tarefa, demonstrando desempenho superior na manutenção
da continuidade temática e Ćuência entre sentenças consecutivas. Em seguida, exploramos a
coerência global, que envolve a consistência lógica e temática de textos inteiros. Nesse aspecto,
o modelo Claude Opus mostrou-se o mais eĄcaz, garantindo que o texto mantenha um Ćuxo
consistente e lógico do começo ao Ąm. Por Ąm, examinamos a capacidade dos modelos em
identiĄcar incoerências, como elementos ou segmentos que quebram a continuidade lógica
e temática. Nessa tarefa, o GPT-4o se destacou, mostrando uma acuidade excepcional na
detecção e sinalização de incoerências. Esse aspecto é crucial para aplicações onde precisão e
clareza são necessárias, como na escrita assistida por IA e na revisão de textos. Nossa análise
comparativa oferece insights sobre as capacidades e limitações dos modelos de linguagem de
grande porte atuais na análise de coerência textual. Além disso, nossos achados contribuem
para a compreensão de como esses modelos podem ser aplicados em diversos contextos de
processamento de linguagem natural, promovendo avanços contínuos neste campo. |
pt_BR |
dc.publisher.country |
Brasil |
pt_BR |
dc.publisher.department |
Centro de Engenharia Elétrica e Informática - CEEI |
pt_BR |
dc.publisher.program |
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO |
pt_BR |
dc.publisher.initials |
UFCG |
pt_BR |
dc.subject.cnpq |
Ciência da Computação |
pt_BR |
dc.title |
LLMs as tools for evaluating textual coherence: a comparative analysis. |
pt_BR |
dc.date.issued |
2024-09-05 |
|
dc.description.abstract |
Textual coherence is fundamental for efective comprehension, determining the clarity, comprehensibility,
and overall quality of content. Recent Large Language Models (LLMs), trained
on extensive corpora, have demonstrated impressive capabilities in producing coherent and
contextually relevant texts, enhancing their potential for textual analysis tasks. However, the
ability of these models to perform coherence analysis on various input texts is still under investigation.
In this study, we evaluate the performance of advanced language models in automatic
textual coherence analysis. The models evaluated include GPT-4o, GPT-3.5, GPT-4, Claude
Opus, Claude 3 Sonet, Claude 3 Haiku, Bard, LLaMA 2 13b, and LLaMA 2 7b. Our research
investigates the ability of these models to evaluate textual coherence at diferent levels. First,
we focus on local coherence, which refers to the logical and contextual consistency between
adjacent sentences or small text segments. Our results indicate that GPT-4o, Claude Opus,
and Gemini excel in this task, demonstrating superior performance in maintaining thematic
continuity and Ćuency between consecutive sentences. Next, we explore global coherence,
involving the logical and thematic consistency of entire texts. Here, the Claude Opus model
proved to be the most efective, ensuring that the text maintains a consistent and logical Ćow
from beginning to end. Finally, we examine the modelsŠ ability to identify incoherences, such
as elements or segments that break the logical and thematic continuity. In this task, GPT-4o
stood out, showing exceptional acuity in detecting and Ćagging incoherences. This aspect is
crucial for applications where precision and clarity are needed, such as AI-assisted writing and
text review. Our comparative analysis provides insights into the capabilities and limitations
of current large language models in textual coherence analysis. Additionally, our Ąndings
contribute to understanding how these models can be applied in various natural language
processing contexts, promoting continuous advancements in this Ąeld. |
pt_BR |
dc.identifier.uri |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/40791 |
|
dc.date.accessioned |
2025-02-27T12:51:55Z |
|
dc.date.available |
2025-02-27 |
|
dc.date.available |
2025-02-27T12:51:55Z |
|
dc.type |
Dissertação |
pt_BR |
dc.subject |
PLN |
pt_BR |
dc.subject |
Comparação |
pt_BR |
dc.subject |
Incoerência |
pt_BR |
dc.subject |
Coerência Textual |
pt_BR |
dc.rights |
Acesso Aberto |
pt_BR |
dc.creator |
BARBOSA, Bryan Khelven da Silva. |
|
dc.publisher |
Universidade Federal de Campina Grande |
pt_BR |
dc.language |
por |
pt_BR |
dc.title.alternative |
LLMs como ferramentas para avaliação da coerência textual: um estudo comparativo análise |
pt_BR |
dc.description.sponsorship |
Capes |
pt_BR |
dc.identifier.citation |
BARBOSA, Bryan Khelven da Silva. LLMs as tools for evaluating textual coherence: a comparative analysis 2024. 117 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024. |
pt_BR |