DSpace/Manakin Repository

LLMs as tools for evaluating textual coherence: a comparative analysis.

Mostrar registro simples

dc.creator.ID BARBOSA, B. K. S. pt_BR
dc.creator.Lattes http://lattes.cnpq.br/8007703579388553 pt_BR
dc.contributor.advisor1 CAMPELO, Cláudio Elízio Calazans.
dc.contributor.advisor1ID CAMPELO, CLAUDIO E. C. pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/8007703579388553 pt_BR
dc.contributor.referee1 MARINHO, Leandro Balby.
dc.contributor.referee2 SANTOS E SOUZA, Marlo Vieira dos Santos.
dc.description.resumo A coerência textual é fundamental para a compreensão eĄcaz, determinando a clareza, a compreensibilidade e a qualidade geral do conteúdo. Modelos de Linguagem de Larga Escala (LLMs) recentes, treinados em corpora extensivos, têm demonstrado capacidades impressionantes em produzir textos coerentes e contextualmente relevantes, aumentando seu potencial para tarefas de análise textual. No entanto, a habilidade desses modelos em realizar a análise de coerência em diversos textos de entrada ainda está sob investigação. Neste estudo, avaliamos o desempenho de modelos de linguagem avançados na análise automática de coerência textual. Os modelos avaliados incluem GPT-4o, GPT-3.5, GPT-4, Claude Opus, Claude 3 Sonet, Claude 3 Haiku, Bard, LLaMA 2 13b e LLaMA 2 7b. Nossa pesquisa investigou a capacidade desses modelos em avaliar a coerência textual em diferentes níveis. Primeiro, focamos na coerência local, que se refere à consistência lógica e contextual entre sentenças adjacentes ou pequenos segmentos de texto. Nossos resultados indicam que GPT-4o, Claude Opus e Gemini se destacam nessa tarefa, demonstrando desempenho superior na manutenção da continuidade temática e Ćuência entre sentenças consecutivas. Em seguida, exploramos a coerência global, que envolve a consistência lógica e temática de textos inteiros. Nesse aspecto, o modelo Claude Opus mostrou-se o mais eĄcaz, garantindo que o texto mantenha um Ćuxo consistente e lógico do começo ao Ąm. Por Ąm, examinamos a capacidade dos modelos em identiĄcar incoerências, como elementos ou segmentos que quebram a continuidade lógica e temática. Nessa tarefa, o GPT-4o se destacou, mostrando uma acuidade excepcional na detecção e sinalização de incoerências. Esse aspecto é crucial para aplicações onde precisão e clareza são necessárias, como na escrita assistida por IA e na revisão de textos. Nossa análise comparativa oferece insights sobre as capacidades e limitações dos modelos de linguagem de grande porte atuais na análise de coerência textual. Além disso, nossos achados contribuem para a compreensão de como esses modelos podem ser aplicados em diversos contextos de processamento de linguagem natural, promovendo avanços contínuos neste campo. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department Centro de Engenharia Elétrica e Informática - CEEI pt_BR
dc.publisher.program PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO pt_BR
dc.publisher.initials UFCG pt_BR
dc.subject.cnpq Ciência da Computação pt_BR
dc.title LLMs as tools for evaluating textual coherence: a comparative analysis. pt_BR
dc.date.issued 2024-09-05
dc.description.abstract Textual coherence is fundamental for efective comprehension, determining the clarity, comprehensibility, and overall quality of content. Recent Large Language Models (LLMs), trained on extensive corpora, have demonstrated impressive capabilities in producing coherent and contextually relevant texts, enhancing their potential for textual analysis tasks. However, the ability of these models to perform coherence analysis on various input texts is still under investigation. In this study, we evaluate the performance of advanced language models in automatic textual coherence analysis. The models evaluated include GPT-4o, GPT-3.5, GPT-4, Claude Opus, Claude 3 Sonet, Claude 3 Haiku, Bard, LLaMA 2 13b, and LLaMA 2 7b. Our research investigates the ability of these models to evaluate textual coherence at diferent levels. First, we focus on local coherence, which refers to the logical and contextual consistency between adjacent sentences or small text segments. Our results indicate that GPT-4o, Claude Opus, and Gemini excel in this task, demonstrating superior performance in maintaining thematic continuity and Ćuency between consecutive sentences. Next, we explore global coherence, involving the logical and thematic consistency of entire texts. Here, the Claude Opus model proved to be the most efective, ensuring that the text maintains a consistent and logical Ćow from beginning to end. Finally, we examine the modelsŠ ability to identify incoherences, such as elements or segments that break the logical and thematic continuity. In this task, GPT-4o stood out, showing exceptional acuity in detecting and Ćagging incoherences. This aspect is crucial for applications where precision and clarity are needed, such as AI-assisted writing and text review. Our comparative analysis provides insights into the capabilities and limitations of current large language models in textual coherence analysis. Additionally, our Ąndings contribute to understanding how these models can be applied in various natural language processing contexts, promoting continuous advancements in this Ąeld. pt_BR
dc.identifier.uri http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/40791
dc.date.accessioned 2025-02-27T12:51:55Z
dc.date.available 2025-02-27
dc.date.available 2025-02-27T12:51:55Z
dc.type Dissertação pt_BR
dc.subject PLN pt_BR
dc.subject Comparação pt_BR
dc.subject Incoerência pt_BR
dc.subject Coerência Textual pt_BR
dc.rights Acesso Aberto pt_BR
dc.creator BARBOSA, Bryan Khelven da Silva.
dc.publisher Universidade Federal de Campina Grande pt_BR
dc.language por pt_BR
dc.title.alternative LLMs como ferramentas para avaliação da coerência textual: um estudo comparativo análise pt_BR
dc.description.sponsorship Capes pt_BR
dc.identifier.citation BARBOSA, Bryan Khelven da Silva. LLMs as tools for evaluating textual coherence: a comparative analysis 2024. 117 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024. pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta