Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/36636
Title: Modelagem de tópicos na estimativa de pontos ideais baseados em discursos de parlamentares brasileiros
Other Titles: Topic Modeling in Estimating Sweet Spots Based on Speeches by Brazilian parliamentarians
???metadata.dc.creator???: SANTOS, Matheus Alves dos.
???metadata.dc.contributor.advisor1???: ANDRADE, Nazareno Ferreira de.
???metadata.dc.contributor.referee1???: CAMPELO , Cláudio Elízio Calazans.
???metadata.dc.contributor.referee2???: FIGUEIREDO, Flavio Vinicius Diniz de.
Keywords: Câmara dos Deputados;Política;Estimativa de Pontos Ideais;Modelagem de Tópicos Latentes;Processamento de Linguagem Natural;Politics; Chamber of Deputies;Ideal Point Estimation;Topic Modeling;Natural Language Processing
Issue Date: 16-Feb-2024
Publisher: Universidade Federal de Campina Grande
Citation: SANTOS, Matheus Alves dos. Modelagem de tópicos na estimativa de pontos ideais baseados em discursos de parlamentares brasileiros. 2024. 93 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024.
???metadata.dc.description.resumo???: Para a construção de democracias fortes e verdadeiramente representativas é de suma importância que a sociedade civil seja capaz de compreender e monitorar a atuação política de seus representantes. Entretanto, apesar dos notáveis avanços na transparência governamental, a população brasileira tende a não acompanhar as atividades parlamentares. Esse cenário se consolida em decorrência de múltiplas questões socioculturais, mas também da intrínseca complexidade do Poder Legislativo. Assim, são necessários métodos e ferramentas que proporcionem acesso à informação para a sociedade civil e, mais do que isso, que colaborem com seu entendimento e uso dessas informações. Nesse âmbito, as técnicas de Processamento de Linguagem Natural têm se difundido na análise dos volumosos conjuntos de dados textuais que permeiam o contexto político, como os discursos ou as proposições de lei. Neste trabalho, avaliamos o uso individual e conjunto de duas técnicas do estado-da-arte para a modelagem de tópicos latentes e a estimativa de pontos ideais baseados em texto, aplicando-as à caracterização dos discursos e posicionamentos políticos de parlamentares brasileiros. Em específico, utilizamos os modelos BERTopic e Text-Based Ideal Point para analisar a 55ª e a 56ª Legislaturas da Câmara dos Deputados, abrangendo o período de 2015 a 2022. Durante esse processo, também construímos e publicamos uma base de dados abertos contendo as transcrições dos discursos em eventos realizados por essa casa legislativa entre 2003 e 2022. A avaliação das técnicas adotadas teve caráter quantitativo e qualitativo, considerando métricas como a coerência e a diversidade de tópicos latentes, mas também a validade aparente e o comparativo com a percepção de especialistas da Ciência Política. O desempenho dos modelos nessa avaliação e as análises baseadas em seus resultados apontam essas técnicas como viáveis, promissoras e capazes de fundamentar novos estudos políticos no cenário brasileiro. Contudo, devido às características inerentes ao Poder Legislativo de nosso país, nossas estimativas divergem da interpretação original dos pontos ideais e, substituindo a tradicional dicotomia esquerda-direita, demonstram o quão “ideológicos” ou “pragmáticos” são os indivíduos analisados.
Abstract: Strong and truly representative democracies can be built only when civil society can understand and monitor the political activities of its representatives. However, despite remarkable progress towards government transparency, people in Brazil tend not to be aware of parliamentary activities. This scenario emerges from multiple socio-cultural aspects, as well as from the structural complexity surrounding the Legislative Branch. Therefore, methods and tools that provide access to information for civil society and, more importantly, contribute to its understanding and usage of such information are essential. In this regard, Natural Language Processing techniques have been increasingly employed to analyze huge textual datasets surrounding political contexts, such as speeches and law proposals. In this study, we evaluated both the individual and the combined use of two state-of-the-art techniques for latent topic modeling and text-based ideal point estimation, applying them to characterize the speeches and political views of Brazilian parliamentarians. Specifically, we used the BERTopic and the Text-Based Ideal Point models to analyze the 55th and 56th Legislatures of the Brazilian Chamber of Deputies, spanning the period from 2015 to 2022. In this process, we also built and published an open database containing speech transcriptions from events held by this legislative house between 2003 and 2022. The evaluation of these techniques was quantitative and qualitative, considering metrics such as coherence and diversity of latent topics, but also the face validity and the comparison to Political Science experts’ opinions. The performance of these models and our analysis of their results suggest that these techniques are viable, promising, and suitable for new political studies in Brazil. Nevertheless, due to the inherent features of the Brazilian Legislative Branch, our estimations differ from the original interpretations regarding these ideal points by replacing the traditional left-right dichotomy and demonstrating how “ideological” or “pragmatic” the analyzed individuals are.
Keywords: Câmara dos Deputados
Política
Estimativa de Pontos Ideais
Modelagem de Tópicos Latentes
Processamento de Linguagem Natural
Politics; Chamber of Deputies
Ideal Point Estimation
Topic Modeling
Natural Language Processing
???metadata.dc.subject.cnpq???: Ciência da Computação
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/36636
Appears in Collections:Mestrado em Ciência da Computação.

Files in This Item:
File Description SizeFormat 
MATHEUS ALVES DOS SANTOS - DISSERTAÇÃO (PPGCC) 2024.pdf2.24 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.