dimanche 8 juin 2008

Une ferme de calcul Carri Systems à Supélec campus de Metz

Une belle histoire pour ce 'cluster' bien né, et astucieusement conçu


La ferme de calcul InterCell est maintenant en fonctionnement dans les locaux de Supélec campus de Metz. C'est une opération du CPER Lorrain (Contrat de Projet État-Région), financée par l'INRIA et déployée par Supélec campus de Metz.

Point de machine Dell ou HP dans ce cluster. La société Carri Systems a damé le pion aux grands constructeurs pour la mise en place de cette solution. Nous avons interrogé à ce sujet Patrick Mercier, responsable des ressources informatiques, Supélec campus de Metz et Ludovic Darmon, directeur commercial, Carri Systems.

Pourquoi Carri Systems, plutôt qu'un des grands du monde informatique ? Patrick Mercier répond - non sans malice - que "Carri Systems a su fournir le bon matériel au bon moment", avant de préciser les raisons qui ont mené à ce choix. Tout d'abord, la réactivité de cette société française a été un argument essentiel pour les responsables du projet. Carri Systems a aussi su créer des configurations sur mesure, finement adaptées aux besoins de l'InterCell (qui nécessite une bonne capacité de calcul et une large bande passante).

512 cœurs et cinq équipes

Chacun des 256 nœuds du système s'architecture autour d'un processeur bicœur Intel Xeon 3075 cadencé à 2,66 GHz et de 4 Go de mémoire (soit un total de 512 cœurs). Le tout est interconnecté en Ethernet Gigabit par un routeur Cisco et fonctionne sous Linux. Quatre nœuds de secours sont également présents, tout comme cinq serveurs frontaux, qui peuvent piloter le cluster en mode interactif. Pour les tâches les plus lourdes, un système de file d'attente est disponible.

InterCell intègre plusieurs techniques permettant de limiter l'espace occupé et la consommation d'énergie. Ainsi, chaque rack 1U (un Carri Systems HighServer SR1520ML) accueille deux cartes-mères pour une seule alimentation. Résultat, la perte est moins importante au niveau du circuit d'alimentation et 128 racks sont suffisants pour accueillir les 256 noeuds. L'encombrement est ainsi réduit à seulement quatre armoires 42 U.

Le système de climatisation est également astucieux : la chaleur « pompée » dans la salle du supercalculateur est réutilisée pour le chauffage du reste du bâtiment. Ceci permet de récupérer 25% de l'énergie consommée par le système de climatisation.

InterCell est à la fois une plate-forme de validation pour Algorille (Algorithmes pour la grille, équipe du Loria de Nancy), mais aussi un outil de travail pour plusieurs laboratoires : Cortex (Loria de Nancy), LMOPS (Laboratoire Matériaux Optiques, Photonique et Systèmes - CNRS), équipe « plasmas chauds » (LPMIA, pour Laboratoire de Physique des Milieux Ionisés et Applications) et l'UMI-2958 (Unité Mixte Internationale, CNRS et Georgia Insistute of Technology).

La présence de cinq intervenants principaux explique celle d'un nombre égal de serveurs frontaux. Ainsi, chaque équipe dispose de son propre accès au cluster, qu'elle peut piloter à sa guise.

La suite ?

L'InterCell est maintenant entré en phase de production. Prochainement, son accès sera probablement ouvert à d'autres chercheurs. Notez que Patrick Mercier travaille également à l'élaboration d'une ferme de calcul comprenant seize machines et autant de cartes graphiques Nvidia. Elle se destine au GPGPU et à Cuda. Carri Systems fournira - là encore - le matériel nécessaire.

Ludovic Darmon nous signale que la compagnie n'en est pas à son premier cluster… ni à son dernier ! La société vient en effet de recruter deux nouveaux spécialistes HPC (High-Performance Computing). Elle a également ouvert une agence Rhône-Alpes située à Grenoble.

Aucun commentaire: