Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.

Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639

Title:	Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais.
Other Titles:	Scaling of applications that process large amounts of data in computational grids. Scaling of applications that process large amounts of data in computational grids
???metadata.dc.creator???:	SANTOS NETO, Elizeu Lourenço dos.
???metadata.dc.contributor.advisor1???:	CIRNE FILHO, Walfredo da Costa.
???metadata.dc.contributor.referee1???:	BRASILEIRO, Francisco Vilar.
???metadata.dc.contributor.referee2???:	KOFUJI, Sergio Takeo.
Keywords:	Sistemas distribuídos.;Grids computacionais.;Escalonamento.;Bag of tasks.;Distributed systems.;Computational grids.;Scheduling.
Issue Date:	18-Feb-2004
Publisher:	Universidade Federal de Campina Grande
Citation:	NETO,Elizeu Florenço dos Santos. Escalonamento de aplicações que processam grandes quantidades de dados em grids computacionais. 2004. 84f. (Dissertação de Mestrado em Ciência da Computação) Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639
???metadata.dc.description.resumo???:	Aplicações que processam grandes quantidades de dados demandam grandes transferências de dados quando executadas em grids computacionais. Estas transferências têm um alto custo associado. Portanto, considerar as transferências de dados é fundamental para se obter escalonamentos eficientes para tais aplicações. Além disso, em ambientes heterogêneos como os grids, as heurísticas que produzem escalonamentos eficientes tipicamente usam informação dinâmica sobre o grid e as aplicações (disponibilidade de rede e CPU, tempo de execução das tarefas, etc). Porém, estas informações são, em geral, difíceis de se obter com precisão. Embora existam escalonadores que alcançam bom desempenho sem usar informações dinâmicas, eles não são desenvolvidos para considerar o impacto das transferências de dados. Neste trabalho apresentamos Storage Affinity, uma nova heurística de escalonamento para aplicações do tipo Bag-of-Tasks que processam grandes quantidades de dados sem depender de informação de difícil obtenção. Além disso, o ambiente de execução considerado é um grid computacional. Storage Affinity explora os padrões de reutilização de dados, comuns em muitas aplicações, pois isto permite considerar as transferências de dados sem usar informações dinâmicas sobre os recursos, reduzindo o tempo total de execução da aplicação. Através do uso de uma estratégia de replicação de tarefas, Storage Affinity efetua escalonamentos eficientes sem depender de informação dinâmica. Os resultados mostram que Storage Affinity pode alcançar uma performance, em média, melhor do que os escalonadores estado-da-arte que dependem de informação, mesmo em situações onde tais escalonadores usam informação perfeita. Em contrapartida, há um acréscimo no consumo de ciclos de CPU (em média, ) para alcançar este desempenho devido a replicação de tarefas.
Abstract:	Data-intensive applications executing over a computational grid demand large data transfers. These are costly operations. Therefore, taking them into account is mandatory to achieve efficient scheduling of data-intensive applications on grids. Further, within an heterogeneous environment such as a grid, good schedules are typically attained by heuristics that use dynamic information about the grid and the applications (network and CPU loads, completion time of tasks, etc). However, these information are often difficult to be obtained accurately. Although there are schedulers that attain good performance without requiring that kind of information, they were not designed to take data transfer delays into account. This work presents Storage Affinity, a novel scheduling heuristic for Bag-of-Tasks and data-intensive applications running on grid environments. Storage Affinity exploits a data reuse pattern, common on many data-intensive applications, allowing it to take data transfer delays into account and reduce the makespan of the application. Further, it uses a replication strategy that yields efficient schedules without relying upon dynamic information that is difficult to obtain. Our results show that Storage Affinity may attain performance that is in average better than that of state-of-the-art knowledge-dependent schedulers, even in the unlikely c a s e when the latter are fed with perfect information. This is achieved at the expense of consuming more CPU cycles (in average, more than not using replication).
Keywords:	Sistemas distribuídos. Grids computacionais. Escalonamento. Bag of tasks. Distributed systems. Computational grids. Scheduling.
???metadata.dc.subject.cnpq???:	Ciência da computação.
URI:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2639
Appears in Collections:	Mestrado em Ciência da Computação.

Files in This Item:

File	Description	Size	Format
ELIZEU LOURENÇO DOS SANTOS NETO - DISSERTAÇÃO PPGI 2004..pdf	Elizeu Lourenço dos Santos Neto Dissertação - PPGI 2004	1.07 MB	Adobe PDF	View/Open

Show full item record