Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.

Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12222

Title:	Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.
Other Titles:	A scaling heuristic adaptive to information availability for data-intensive bag-of-tasks applications in computational grids.
???metadata.dc.creator???:	ASSIS, Leonardo de.
???metadata.dc.contributor.advisor1???:	BRASILEIRO, Francisco Vilar.
???metadata.dc.contributor.referee1???:	BARCELLOS, Antonio Marinho Pillã.
???metadata.dc.contributor.referee2???:	BUZATO, Luiz Eduardo.
Keywords:	Redes de Computadores;Escalonamento;Grids Computacionais;Computer Network;Scheduling;Computational Grids
Issue Date:	2-Sep-2009
Publisher:	Universidade Federal de Campina Grande
Citation:	ASSIS, L. de. Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais. 2009. 75 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2009. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12222
???metadata.dc.description.resumo???:	A tecnologia de grids foi criada com o objetivo de facilitar o compartilhamento de recursos entre indivíduos que estão vinculados a diferentes domínios administrativos. Nos últimos anos, o uso de grids computacionais está cada vez mais comum devido ao grande poder computacional que esta tecnologia pode prover a um baixo custo. Devido a isso, a execução de aplicações paralelas que processam uma grande quantidade de dados (dataintensive) está cada vez mais comum neste tipo de plataforma. Uma aplicação paralela pode ser vista como uma coleção de tarefas que podem ser executadas em paralelo. Para algumas destas aplicações, essas tarefas são independentes e podem ser escalonadas para execução paralela em qualquer ordem. Este tipo de aplicação paralela é referenciada na literatura como aplicações Bag-of-Tasks (BoT). Com o intuito de escalonar tarefas em recursos de uma maneira eficiente, escalonadores de aplicações em grid utilizam heurísticas de escalonamento. As heurísticas de escalonamento existentes podem ser classificadas em duas abordagens: i) heurísticas bin-packing, e ii) heurísticas baseadas em replicação. A primeira abordagem requer informação completa e precisa sobre o ambiente de execução e a aplicação. A segunda abordagem não utiliza informação alguma, mas, ao invés disso, ela aplica o princípio da replicação de tarefas para atingir um bom desempenho. Porém, ambas abordagens têm desvantagens; obter informação completa e precisa sobre o ambiente de execução e a aplicação não é sempre possível em um ambiente de grid computacional, enquanto que a redundância das heurísticas baseadas em replicação ocasiona no desperdício de recursos. Em um trabalho recente, foi investigado que apesar de que em um ambiente de grid a informação precisa é difícil de se obter, o acesso a ela não é impossível. Na prática, parte da informação pode ser obtida usando serviços que coletam informação sobre o ambiente de execução e publicada em serviços de informação do grid. Aquele mesmo trabalho mostrou que é possível reduzir o custo de execução de aplicações CPU-intensive, mantendo a mesma eficiência, usando qualquer informação que esteja disponível. Com base no pressuposto daquele trabalho, este trabalho apresenta uma heurística de escalonamento para aplicações BoT data-intensive, que é adaptativa à disponibilidade da informação, chamada de Adaptive Data-Intensive. Os resultados obtidos pela heurística Adaptive Data-Intensive mostraram que o uso racional da informação que estiver disponível leva a uma redução no tempo de execução da aplicação e no desperdício dos recursos.
Abstract:	The technology of grid was created to facilitate the resource sharing among individuals belonging to different administrative domains. In recent years, the use of grid computing is increasingly common due to the large computational power that this technology can provide at a low cost. Because of this, the execution of parallel applications that process a large amount of data (data-intensive) is increasingly common in this type of platform. A parallel application can be viewed as a collection of tasks that can be executed in parallel. A parallel application can be viewed as a collection of tasks that can be executed in parallel. For some of these applications, these tasks are independent and can be scheduled to run parallel in any order. This type of parallel application is referenced in literature as Bag-of-Tasks (BoT) applications. In order to schedule tasks onto resources in an efficient manner, grid applications schedulers use scheduling heuristics. The scheduling heuristics can be classified into two approaches: i) bin-packing heuristics, and ii) heuristics based on replication. The first approach requires complete and accurate information about the execution environment and the application. The second approach does not use any information, but, instead, it applies the principle of tasks replication to achieve good performance. But both approaches have disadvantages, complete and accurate information about the execution environment and the application is not always possible in a grid computing environment, while the redundancy of replication heuristics causes resource waste. In a recent work, it was investigated despite the fact that in a grid environment, the accurate information is difficult to get, it is not impossible to have it. In practice, the information can be obtained by using services that collect information about the environment and the application and publish it on grid information services. That same study showed that it is possible to reduce the execution cost of CPU-intensive applications, while maintaining the same efficiency, using any information that is available. Based on the assumption of that work, this dissertation presents a scheduling heuristic for BoT data-intensive applications that is adaptive to the information availability, called Adaptive Data-Intensive. The results obtained by heuristic Adaptive Data-Intensive indicated that the rational use of available information leads to a reduction of application execution time and resource waste.
Keywords:	Redes de Computadores Escalonamento Grids Computacionais Computer Network Scheduling Computational Grids
???metadata.dc.subject.cnpq???:	Ciência da Computação
URI:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12222
Appears in Collections:	Mestrado em Ciência da Computação.

Files in This Item:

File	Description	Size	Format
LEONARDO DE ASSIS – DISSERTAÇÃO (PPGCC) 2009..pdf	Leonardo de Assis - Dissertação PPGCC 2009.	697.61 kB	Adobe PDF	View/Open

Show full item record