Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/17873
Title: Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.
Other Titles: An ensemble based on decision trees to predict the occurrence of bus clusters.
???metadata.dc.creator???: SANTOS , Veruska Borges
???metadata.dc.contributor.advisor1???: PIRES , Carlos Eduardo Santos.
???metadata.dc.contributor.advisor2???: NASCIMENTO FILHO, Dimas Cassimiro do.
???metadata.dc.contributor.referee1???: MARINHO , Leandro Balby.
???metadata.dc.contributor.referee2???: GAMA, Kiev Santos da.
Keywords: Transporte Público;Aglomerado de Ônibus;Aprendizagem de Máquina;Headway;Public Transportation;Bus Bunching;Machine Learning
Issue Date: 6-Oct-2020
Publisher: Universidade Federal de Campina Grande
Citation: SANTOS, V. B. Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus. 2020. 97 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2020.
???metadata.dc.description.resumo???: Atrasos nas viagens e superlotação de ônibus são algumas das insatisfações diárias dos usuários de transporte público. Esses problemas podem estar associados aos aglomerados de ônibus, eventos que ocorrem quando dois ou mais ônibus estão executando a mesma rota juntos, ou seja, chegam no mesmo horário nas paradas de ônibus. Devido à natureza estocástica do tráfego, um horário programado estático não é eficaz para evitar a ocorrência desses eventos; assim, são necessárias ações preventivas para melhorar a confiabilidade do sistema de transporte público. Os trabalhos já propostos no contexto preditivo de aglomerados de ônibus apresentam ainda limitações relacionadas à frequência ou privacidade dos dados utilizados, além da eficácia limitada à contextos específicos. Assim, este trabalho propõe um ensemble baseado em modelos de árvores de decisão para prever a formação de aglomerados de ônibus. O ensemble utiliza dados de geolocalização de ônibus, dados programados, dados de clima, da situação de tráfego e é composto pelos modelos Random Forest, XGBoost e CatBoost. Além disso, uma técnica de aprendizagem incremental é incorporada ao modelo proposto para continuamente atualizá-lo de acordo com a chegada de novos dados em tempo real. A eficácia do modelo é demonstrada com o uso de dados reais de duas cidades brasileiras e comparada com quatro modelos competidores: Regressão Linear, Regressão Logística, Support Vector Machine e Relevance Vector Machine. De acordo com os resultados, o modelo proposto é capaz de alcançar uma eficácia entre 73% − 80%, superior aos modelos competidores avaliados, e pode ser usado para prever a formação de aglomerados de ônibus em tempo real até dez paradas antes da ocorrência.
Abstract: Travel delays and bus overcrowding are some of the daily dissatisfactions of public transportation users. These problems may be caused by bus bunching, an event that occurs when two or more buses are running the same route together, i.e., arriving at the same time at the bus stops. Due to the stochastic nature of the traffic, a static schedule is not effective to avoid the occurrence of these events; thus, preventive actions are necessary to improve the reliabil ity of the public transportation system. The works already proposed in the predictive context of bus bunching still have limitations related to the frequency or privacy of the data used, in addition to the effectiveness limited to specific contexts. Therefore, we propose a decision tree-based ensemble model to predict bus bunching. We use an ensemble of Random Forest, XGBoost and CatBoost models with buses geolocation, scheduled, weather and traffic situation data. In addition, an incremental learning technique was incorporated into the proposed model to continuously update it according new data arrives in real-time. The efficacy of the proposed model has been demonstrated using real data sets of two brazilian cities and has been compared with four competitors: Linear Regression, Logistic Regression, Support Vector Machine and Relevance Vector Machine. According to the results, the proposed model can achieve an efficacy between 73% − 80%, higher than the evaluated competitors models, and can be used to predict bus bunching in real-time up to ten stops before their occurrence.
Keywords: Transporte Público
Aglomerado de Ônibus
Aprendizagem de Máquina
Headway
Public Transportation
Bus Bunching
Machine Learning
???metadata.dc.subject.cnpq???: Ciência da Computação
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/17873
Appears in Collections:Mestrado em Ciência da Computação.

Files in This Item:
File Description SizeFormat 
VERUSKA BORGES SANTOS - DISSERTAÇÃO (PPGCC) 2020.pdf2.76 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.