Writing parallel programs for distributed multiuser computing environments is a di cult task. The Distributed object migration environment (Dome) addresses three major issues of parallel computing in an architecture independent manner: ease of programming, dynamic load balancing, and fault tolerance. Dome programmers, with modest e ort, can write parallel programs that are automatically distributed over a heterogeneous network, dynamically load balanced as the program runs, and able to survive compute node and network failures. This paper provides the motivation for and an overview of Dome, including a preliminary performance evaluation of dynamic load balancing for distributed vectors. Dome programs are shorter and easier to write than the equivalent programs written with message passing primitives. The performance overhead of Dome is characterized, and it is shown that this overhead can be recouped by dynamic load balancing in imbalanced systems. Finally, we show that a parallel program can be made failure resilient through Dome's architecture independent checkpoint and restart mechanisms. Currently visiting CMU from Universidade Federal de Minas Gerais, Brasil, with support provided by CNPq.
Heterogeneity has been recognized as an important way of improving the performance of multiprocessors by using fast processors to reduce the execution time of the serial fraction of a parallel computation. This paper considers multiprogrammed multiprocessors and parallel programs modeled as random task graphs. A theoretical analytical model to study combinations of extreme cases of workload parallelism (highly parallel versus highly sequential) and of system utilization (light versus heavy load) is presented. A simulation model was used to study intermediate cases. From these two models, conditions under which heterogeneity presents a significant performance improvement over homogeneous architectures are derived. The paper concludes with a study of the effect of scheduling policies for heterogeneous architectures on workloads of different degrees of parallelism under various system load conditions.
Redes de estações de trabalho são um ambiente adequado para processamento paralelo. Ambientes de computação distribuída como o PVM provêm integração entre máquinas heterogêneas a fim de suportar a execução de vários jobs paralelos. Embora estes sistemas permitam que programas paralelos executem num conjunto de estações de trabalho, eles não tratam questões relativas ao gerenciamento e coordenação da distribuição do trabalho pela rede. Este trabalho trata o problema do escalonamento de jobs paralelos numa rede heterogênea de estações de trabalho. Heterogênea significa nesse contexto uma gama de arquiteturas de processadores e um amplo conjunto de jobs paralelos, com graus de paralelismo diferentes e mutáveis, co-existindo com jobs seqüenciais. O artigo consiste de duas partes. A primeira apresenta o projeto e a implementação de um escalonador distribuído para jobs paralelos, cujos objetivos são manter uma carga de trabalho balanceada e reduzir o tempo médio de execução dos jobs. A segunda parte analisa o impacto de jobs paralelos globais na performance de jobs interativos locais e propõe mecanismos para minimizar este impacto.
Este artigo aborda o problema do balanceamento interno de carga de programas paralelos em redes de workstations homogêneas e heterogêneas. O conceito de programas paralelos auto-balanceáveis é discutido. Um estudo detalhado do balanceamento de carga de programas Dome [1] é apresentado. Os principais objetivos são quantificar os ganhos obtidos com o balanceamento da carga e identificar os obstáculos mais importantes para a obtenção de ganhos adicionais. Ambientes homogêneos e heterogêneos, estáveis e instáveis foram analisados. Os resultados indicam que a obtenção de ganhos relevantes com o balanceamento de carga está vinculada a uma escolha cuidadosa do número de operações paralelas que devem ser executadas antes da próxima etapa de balanceamento de carga e que este número deve ser dinamicamente determinado por algum algoritmo adaptativo em função da heterogeneidade e da estabilidade do ambiente.
Este trabalho realiza um estudo sobre o conceito de Working Set de Processadores em sistemas paralelos multi programados e discute a implementação de duas políticas de escalonamento baseadas nesse conceito. Resultados obtidos através de simulações mostram que uma dessas políticas tem um bom desempenho comparando-se a outras já existentes.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.