Uma arquitetura híbrida para o suporte de protocolos distribuídos tolerantes a falhas.

Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11009

Title:	Uma arquitetura híbrida para o suporte de protocolos distribuídos tolerantes a falhas.
Other Titles:	A hybrid architecture for supporting fault tolerant distributed protocols.
???metadata.dc.creator???:	BRITO, Andrey Elísio Monteiro.
???metadata.dc.contributor.advisor1???:	BRASILEIRO, Francisco Vilar.
???metadata.dc.contributor.referee1???:	MELCHER, Elmar Uwe Kurt.
???metadata.dc.contributor.referee2???:	LIMA, George Marconi de Araújo.
Keywords:	Sistemas Distribuídos;Tolerância a Falhas;Sistemas Síncronos;Protocolos de Consenso;Sistemas Embarcados;Distributed Systems;Fault Tolerance;Synchronous Systems;Consensus Protocols;Embedded Systems
Issue Date:	20-Feb-2004
Publisher:	Universidade Federal de Campina Grande
Citation:	BRITO, A. E. M. Uma arquitetura híbrida para o suporte de protocolos distribuídos tolerantes a falhas. 2004. 102 f. Dissertação (Mestrado em Informática) – Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2004. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11009
???metadata.dc.description.resumo???:	A maioria das infra-estruturas disponíveis para implantação de aplicações distribuídas são caracterizadas pela ausência de limites superiores conhecidos nos atrasos de transmissão de mensagens e de escalonamento de processos, i.e. elas são sistemas assíncronos. Esses sistemas são tidos como o melhor ambiente para o desenvolvimento de aplicações devido à portabilidade e escalabilidade decorrente da falta de considerações temporais fortes sobre o sistema. Entretanto, alguns dos mais fundamentais problemas dos sistemas distribuídos não podem ser resolvidos nesses sistemas quando estes estão sujeitos a falhas. Os sistemas síncronos, por outro lado, permitem soluções triviais para os problemas básicos dos sistemas distribuídos tolerantes a falhas. Isso acontece porque eles garantem um atraso máximo conhecido no escalonamento de processos e nos atrasos na transmissão de mensagens. Entretanto, a maior parte dos sistemas práticos não são síncronos, e isso motivou a criação de modelos intermediários entre esse dois tipos, chamados de modelos parcialmente síncronos. Um dos mais populares modelos parcialmente síncronos é o modelo assíncrono equipado com detectores de falhas não confiáveis. Neste modelo cada processo possui acesso a um módulo que pode fornecer informações sobre quais processos falharam. Entre os detectores de falhas propostos, o detector de falhas com semântica perfeita é o mais forte e o único que não comete erros (por exemplo, suspeitando de processos que não falharam). Infelizmente, detectores de falhas perfeitos só podem ser implementados em sistemas síncronos. Como algumas aplicações exigem detectores de falhas perfeito, estes detectores têm recebido uma crescente atenção na literatura. Para implementá-los, subsistemas síncronos de capacidade bastante limitada têm sido desenvolvidos sob o sistema parcialmente síncrono onde as aplicações executam. Este trabalho detalha a implementação de um subsistema síncrono em um ambiente assíncrono formado por uma rede de PCs conectados por uma rede local e executando um sistema operacional de prateleira. Finalmente, embora a implementação de detectores de falhas perfeitos, por si só justifique a implementação de um subsistema síncrono, nós acreditamos que abstrações mais fortes que os detectores de falhas perfeitos podem ser desenvolvidas. Apresentamos uma destas abstrações, o Compilador de Estados Globais, que possibilita soluções mais rápidas para o problema do consenso, onde vários processos tentam entrar em acordo sobre um valor proposto.
Abstract:	Most of the infra-structures for deploying distributed applications are characterized by the absence of known upper bounds in the communication and process scheduling delays, i.e. they are asynchronous systems. Asynchronous systems are considered to be the best environment to develop applications for its portability and scalability, consequence of the lack of strong timing assumptions about the system. Unfortunately, most of the basic problems of distributed systems cannot be solved in such a system when they are subjected to failures. On the other hand, the synchronous systems allow trivial solutions to the basic problems of distributed systems. This is consequence of the existence of known upper bounds in communication and scheduling delays. However, most of the practical systems are not synchronous, and this fact motivates the conception of intermediate models between these two systems, named partially synchronous models. One of the most popular partially synchronous model is the asynchronous model equipped with an unreliable failure detector. This model consists in an asynchronous model, in which each process has access to a module that gives information about which processes have failed. Among the proposed failure detectors, the perfect failure detector is the strongest and is the only one which does not make mistakes (for example, by suspecting processes that did not fail). Unfortunately, perfect failure detectors can only be implemented in synchronous systems. However, as some applications require perfect failure detectors, the interest in them has recently raised. A recent approach taken by the designers of such systems is to implement synchronous subsystems with very limited capacity underneath the partially synchronous system where the applications execute. This work details the implementation of a synchronous subsystem in an environment composed of standards PCs connected through a local area network and running an off-the-shelf operating system. Finally, although the implementation of perfect failure detectors by itself justify the development of such synchronous subsystem, we believe that stronger abstractions than the perfect failure detectors can be developed. We introduce one of these abstractions, the Global State Digest Provider, which allows faster solutions to the consensus problem, where processes try to agree in a proposed value.
Keywords:	Sistemas Distribuídos Tolerância a Falhas Sistemas Síncronos Protocolos de Consenso Sistemas Embarcados Distributed Systems Fault Tolerance Synchronous Systems Consensus Protocols Embedded Systems
???metadata.dc.subject.cnpq???:	Ciência da Computação
URI:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11009
Appears in Collections:	Mestrado em Ciência da Computação.

Files in This Item:

File	Description	Size	Format
ANDREY ELÍSIO MONTEIRO BRITO – DISSERTAÇÃO (PPGCC) 2004.pdf	Andrey Elísio Monteiro Brito - Dissertação (PPGCC). 2004	968.28 kB	Adobe PDF	View/Open

Show full item record