Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/26560
Title: Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
Other Titles: Inclusive feedback heuristic algorithm for process data regression.
???metadata.dc.creator???: FERNANDES, Thalita Cristine Ribeiro Lucas.
???metadata.dc.contributor.advisor1???: ARAÚJO, Antonio Carlos Brandão de.
???metadata.dc.contributor.referee1???: P. NETO, Antonio Tavernard.
???metadata.dc.contributor.referee2???: ALVES, José Jailson Nicácio.
???metadata.dc.contributor.referee3???: SILVA, Vimário Simões.
???metadata.dc.contributor.referee4???: SILVA, Sidinei Kleber da.
???metadata.dc.contributor.referee5???: S. JÚNIOR, Heleno Bispo da.
Keywords: Modelos substitutos;Algoritmo;Aprendizado de máquina;Automação;Processos químicos;Substitute models;Algorithm;Machine learning;Automation;Chemical processes;Modelos sustitutos;Aprendizaje automático;Automatización;Procesos químicos;Modèles de substitution;Algorithme;Apprentissage automatique;Automatisation;Procédés chimiques
Issue Date: 27-Apr-2022
Publisher: Universidade Federal de Campina Grande
Citation: FERNANDES, T. C. R. L. Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. 2022. 190 f. Tese (Doutorado em Engenharia Química) – Programa de Pós-Graduação em Engenharia Química, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2022.
???metadata.dc.description.resumo???: Este trabalho apresenta um algoritmo de aprendizado de máquina automatizado (AutoML) sitemático e simples. A principal contribuição é produzir o modelo de regressão mais simples, sempre que possível (ex.: modelo de regressão polinomial de segunda ordem via seleção de recursos sequenciais baseado nos mínimos quadrados) ou então, gerar modelos não lineares mais complexos (ex.: regressão gaussiana). O algoritmo é capaz de produzir estes resultados usando técnicas de design sequencial para preencher habilmente o espaço amostral com pontos “interessantes”, gerando um conjunto de dados que é utilizado para selecionar o modelo de regressão mais simples possível. Esse modelo mais simples é gerado de forma iterativa a partir de um conjunto predefinido de modelos de regressão candidatos. O objetivo é minimizar o número de chamadas para o processo gerador (simulador), resultando no menor número de amostras. Cada conjunto de dados produzidos iterativamente é usado de forma exaustiva e eficaz, capaz de convergir até mesmo respostas difíceis que requerem um grande número de amostras. A aplicação do algoritmo proposto em casos importantes (equações matemáticas de difícil resolução, coluna de destilação em Aspen Plus e uma Planta de tratamento de efluentes em Simulink) mostra sua efetividade na construção de metamodelos com capacidade preditiva significante. É sugerida a utilização de técnicas de regressão puramente não lineares em situações que as simulações demandem mais tempo do que o processamento do algoritmo. Em geral, um mix de métodos de regressão linear e não linear para a construção dos metamodelos é recomendada para a maioria dos casos, para compensar o tempo de processamento e a capacidade preditiva.
Abstract: This is an attempt to create a simple, but quite systematic, automated machine learning (AutoML) algorithm. The main contribution is to produce the simplest regression model (e.g., second order polynomial regression model via OLS based sequential feature selection) whenever possible, or else generate more complex, and therefore less desirable, nonlinear (e.g., gaussian process regression) models. It does so by efficiently using sequential design techniques to cleverly fill the sample space with “interesting” points, generating a dataset (which includes the responses obtained by “querying” the actual underlying process) on demand that is used to select the simplest possible regression model, among a predefined set of candidate regression models, in an iteratively way until particular convergence criteria are met. The intended goal is therefore to minimize the number of calls to the generating process, resulting in the least number of samples. Each dataset produced iteratively is exhaustively and effectively used up in an effort to converge even difficult responses that have not met the criteria even with a large number of samples. Application of the proposed algorithm to important cases shows its effectiveness in building metamodels with significant predictive capabilities. It is suggested the use of pure nonlinear regression techniques in situations in which data takes more time to gather than to be processed by the algorithm. In general, a carefully chosen mix of both linear and nonlinear regression methods to metamodel building is recommended for most cases, as a tradeoff between processing time and predictive capacity.
Keywords: Modelos substitutos
Algoritmo
Aprendizado de máquina
Automação
Processos químicos
Substitute models
Algorithm
Machine learning
Automation
Chemical processes
Modelos sustitutos
Aprendizaje automático
Automatización
Procesos químicos
Modèles de substitution
Algorithme
Apprentissage automatique
Automatisation
Procédés chimiques
???metadata.dc.subject.cnpq???: Engenharia Química
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/26560
Appears in Collections:Doutorado em Engenharia Química.

Files in This Item:
File Description SizeFormat 
THALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdf7.4 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.