Calcul itératif asynchrone à grande échelle sur des architectures hétérogènes et volatiles (Large scale iterative asynchronous computing over distributed heterogeneous volatil architectures) | ||
Charr, Jean-Claude - (2009-09-16) / Université de Franche-Comté - Calcul itératif asynchrone à grande échelle sur des architectures hétérogènes et volatiles en : Français Directeur(s) de thèse: Couturier, Raphaël Laboratoire : LIFC Ecole doctorale : SPIM Classification : Informatique | ||
Mots-clés : algorithmes parallèles itératifs asynchrones, plateforme décentralisée, tolérance aux pannes, systèmes linéaires et non linéaires. Résumé : Avec l'émergence de nouvelles architectures distribuées, comme les grappes de calcul distantes et les architectures de calcul volontaire, il apparaît important de définir des algorithmes et des intergiciels bien adaptés à ces architectures. En effet, l'utilisation de ces plate-formes introduit plusieurs nouvelles contraintes par rapport à un contexte de grappes locales homogènes : hétérogénéité des machines, hétérogénéité des réseaux, volatilité des noeuds de calcul, etc. Dans ce contexte, plusieurs travaux montrent que pour les algorithmes itératifs il peut être préférable d'utiliser les algorithmes IACA (Itérations Asynchrones avec Communications Asynchrones) pour lesquels les communications sont recouvertes par du calcul et la perte des messages de données est tolérée. Les travaux présentés dans cette thèse concernent la conception et la mise en oeuvre d'une plate-forme dédiée à l'exécution d'algorithmes IACA sur des architectures distribuées, hétérogènes et volatiles. Cette plate-forme, JACEP2P-V2, est tolérante aux pannes et décentralisée. Elle offre un mécanisme de communications asynchrones et un mécanisme de détection de la convergence globale adapté aux caractéristiques des algorithmes IACA. De plus, nous reportons des expérimentations sur grappes hétérogènes volatiles et distantes afin de tester l'efficacité et la robustesse de notre plate-forme. Les résultats obtenus, avec plus de 1000 coeurs de calculs, sont très encourageants et montrent que JACEP2P-V2 est extensible et performante. Nous terminons ce document par la présentation d'une étude comparative de plusieurs méthodes de résolutions de systèmes non linéaires (comme la multi-décomposition et la relaxation d'ondes) implémentées avec JACEP2P-V2. Résumé (anglais) : With the emergence of new distributed architectures, such as distributed clusters and volunteer computing architectures, it seems important to design algorithms and middlewares that are well adapted to these architectures. Indeed, when using these architectures, developers are faced with many new constraints that they do not encounter when using local clusters, like the heterogeneity of the machines and the networks that interconnect them, the volatility of the computing nodes, etc. In this context, many research works show that for iterative methods, it is preferred to use the AIAC (Asynchronous iterations with Asynchronous Communications) model where the communications are overlapped by the computations and the loss of data messages is tolerated. The research work, presented in this document, concerns the design and the implementation of a platform dedicated to executing AIAC algorithms over distributed heterogeneous volatile architectures. This platform, JACEP2P-V2, is fault tolerant and decentralized. It offers an asynchronous communication mechanism and a global convergence detection mechanism well adapted to the characteristics of AIAC algorithms. Moreover, we present many experiments that we have conducted over volatile distributed heterogeneous architectures using JACEP2P-V2 in order to test the efficiency and robustness of our platform. The experiments' results are very encouraging and prove that JACEP2P-V2 is scalable and powerful. We end this document with a comparative study of many methods that solve nonlinear systems (such as Multisplitting and Waveform relaxation) and are implemented according to JACEP2P-V2's APl. Identifiant : UFC-277 |
Exporter au format XML |