Il existe en France un maillage de plus de 40 mésocentres. Ces supercalculateurs réunissent des moyens humains ainsi que des ressources matérielles et logicielles pour les mettre à disposition d’une ou plusieurs communautés scientifiques d’une même région : universités, centres de recherche ou encore EPST (Établissement Public à caractère Scientifique et Technologique).
Ces centres de calcul jouent un rôle extrêmement important pour les chercheurs puisqu’en mutualisant l’utilisation des infrastructures, ils permettent à des institutions qui n’auraient pas les moyens de s’offrir une telle puissance de calcul d’accéder aux technologies les plus performantes pour mener à bien leurs projets de recherche, et ce dans une grande variété de domaines : génétique, météorologie, biologie moléculaire, mécanique des fluides, etc.
Mais les mésocentres sont aujourd’hui confrontés à un défi : continuer à augmenter la puissance de calcul tout en diminuant l’empreinte énergétique des infrastructures.
Quatre leviers à actionner pour moins de watts et plus de flops
Face aux enjeux environnementaux et à l’explosion de la facture énergétique, les communautés scientifiques doivent faire les bons choix et repenser les datacenters. Différents leviers peuvent permettre à ces organisations de construire des mésocentres moins énergivores.
- Des équipements éco-conçus
Outre les critères de pure performance, différentes caractéristiques peuvent aiguiller les choix en matière de hardware.
Évidemment, la consommation énergétique des serveurs est un premier indicateur. Pour pouvoir comparer efficacement, les fournisseurs doivent jouer la carte de la transparence et permettre aux organisations de mesurer la consommation et les émissions. Des labels comme Energy Star peuvent constituer ici de bons points de repère pour identifier les serveurs les plus efficaces d’un point de vue énergétique.
Certains serveurs peuvent tolérer une température ambiante jusqu’à 45° C.
La température supportée dans la salle est également importante. Certains serveurs peuvent par exemple tolérer jusqu’à 45° C, ce qui permet de limiter le recours à la climatisation dans le mésocentre. Pour cela, la conception même des systèmes doit avoir été pensée pour favoriser l’évacuation de la chaleur générée (le design du châssis, la position des composants, les matériaux utilisés, etc.).
La présence d’accélérateurs dédiés à certains cas d’usage est également à surveiller. GPU, ASIC, FPGA ou encore IPU, ces unités sont conçues pour réaliser avec un maximum d’efficacité certaines tâches spécifiques, plutôt que de tout miser sur le CPU. Avec la bonne association, il est possible d’obtenir de très hautes performances avec une consommation moindre.
Globalement, la modernisation de l’infrastructure peut permettre de dégager des économies d’énergie. Un serveur récent est capable aujourd’hui d’exécuter le travail de cinq serveurs d’ancienne génération. En consolidant efficacement les charges de travail, de nombreux systèmes énergivores pourraient être débranchés.
- Une intelligence logicielle pour mesurer et optimiser
Les capacités de gestion fournies avec les appareils sont primordiales. Des fonctionnalités de mesure tout d’abord, doivent permettre de monitorer en temps réel l’énergie consommée au niveau de chaque système et de chaque workload, mais aussi de contrôler le niveau de charge de chaque équipement.
Ensuite, à partir de ces informations, l’AIOps peut entrer en jeu. L’intelligence artificielle appliquée aux opérations IT va permettre par exemple de mieux consolider les workloads pour utiliser au maximum les capacités disponibles sur chaque machine, d’identifier des serveurs qui consomment de l’énergie alors qu’aucune charge de travail ne leur est attribuée ou encore de savoir quand le remplacement d’un matériel permettrait de gagner en efficacité énergétique.
La mise en place de politiques automatisées d’équilibrage de charge ou de plafonnement de la consommation permettra de diminuer la quantité d’énergie utilisée, surtout dans des centres dont les serveurs ne sont pas utilisés en permanence.
- Air, eau ou immersion : repenser le refroidissement
C’est sans doute un des points clés pour réduire l’empreinte du mésocentre. Le refroidissement peut représenter entre 30 et 50 % de la consommation énergétique d’un datacenter. Dans un supercalculateur qui pousse les composants à leur maximum, agir sur ce levier peut donc générer des gains extrêmement importants.
L’eau offre une capacité d’extraction thermique 4 fois supérieure à celle de l’air.
Plusieurs approches innovantes existent. Tout d’abord, la ventilation intelligente, qui consiste à coupler une intelligence artificielle aux ventilateurs traditionnels pour en améliorer l’efficacité.
Ensuite, le refroidissement liquide direct. Celui-ci consiste à apposer directement sur les CPU/GPU des plaques de métal reliées à un circuit d’eau, qui va se charger de refroidir les plaques en continu et d’extraire la chaleur des serveurs. L’eau offre une capacité d’extraction thermique 4 fois supérieure à celle de l’air, cette méthode est particulièrement efficace.
Enfin, dernière solution : le refroidissement par immersion. Ici, les serveurs sont plongés dans un fluide caloporteur qui va amener la chaleur vers un échangeur thermique.
Et pour faire baisser encore davantage l’empreinte et la facture, la chaleur récupérée dans le datacenter peut ensuite être réintroduite dans un réseau de chauffage urbain pour venir pour chauffer des bâtiments voisins.
- Un nouveau modèle pour éviter la surconsommation
Autre transformation qui peut porter ses fruits : changer le modèle de consommation. En optant pour des infrastructures en mode « as a service » plutôt que pour une acquisition classique, les organisations peuvent non seulement se décharger de nombreuses et chronophages tâches de gestion et déploiement, pour se concentrer sur leurs travaux de recherche, mais elles peuvent également en tirer des bénéfices énergétiques.
L’IT-as-a-Service permettrait de réduire le surprovisionnement jusqu’à 37 %.
Avec des infrastructures HPC commercialisées sous forme d’abonnement, il est en effet plus simple de ne provisionner que les capacités nécessaires. L’IT-as-a-Service permettrait de réduire le surprovisionnement jusqu’à 37 % et les coûts liés à l’alimentation et au refroidissement des équipements sous-utilisés jusqu’à 45 %.1
Il n’existe pas une seule façon de réduire la consommation énergétique d’une plateforme de calcul intensif. Pour atteindre l’objectif, il faudra mesurer sa consommation, comprendre ses usages et ses besoins, puis mettre en œuvre les technologies matérielles et logicielles qui permettront de tirer le maximum de chaque watt consommé !
1Dell Technologies, Evolving Business Models, 7 octobre 2021
Une réponse
Cet article met en lumière un défi crucial pour les mésocentres : concilier puissance de calcul et empreinte énergétique réduite. Les innovations dans le refroidissement, de la ventilation intelligente à l’immersion, démontrent l’importance de repenser les infrastructures.
Le passage à un modèle « as a service » apparaît comme une opportunité majeure pour réduire la surconsommation. Un article éclairant sur les enjeux énergétiques des mésocentres.