Ordonnancement en ligne de tâches IT et engagement de sources dans un centre de calcul alimenté par des énergies renouvelables - IRIT - Toulouse INP Accéder directement au contenu
Thèse Année : 2023

Online scheduling for IT tasks and power source commitment in data centers only operated with renewable energy

Ordonnancement en ligne de tâches IT et engagement de sources dans un centre de calcul alimenté par des énergies renouvelables

Résumé

Global warming is one of the biggest humanity challenges. Fossil fuels are one of the world's main sources of energy production, which emits greenhouse gas emissions (GHG) in the atmosphere. Paris Agreement established some objectives for the end of Century 21. The main goal is to limit the temperature increase to 2 C, trying to limit it to 1.5 C. However, recent reports show we are walking toward a temperature increase of 2.8 C. The data center sector is a significant GHG emitter, with 1% of the global energy-related GHG emissions. A way to reduce the data center's impact on GHG emissions is by reducing the energy needed by the servers. However, some authors pointed out a reduction in the processor energy improvements. Furthermore, with the expected increase in Internet users (up to 5.3 billion in 2023), the situation tends to get even worse. A possible solution is migrating energy production from brown sources (fossil fuels) to green sources (renewable energy sources - RES). It generates energy from natural sources, such as solar and wind. The biggest drawback of implementing RES is its intermittence since its production comes from nature, depending on the climate conditions. Big cloud providers invest in off-site solar and wind power plants, which means they provide renewable energy to the grid with the same amount they expend. Therefore, they transfer the intermittence problem to third parties. This thesis takes place in Datazero2 project proposing a renewable-only data center with only on- site renewable production. This kind of data center would drastically reduce their GHG emissions. However, a renewable-only data center introduces several challenges. We deal with these challenges in two parts: offline and online. The offline side uses predictions to plan decisions considering the long-term. The online side must apply the offline plan, reacting to the actual events of the data center. Since the predictions are imperfect, the online must find ways to adapt the offline plan, reducing the impact on the user's jobs. Considering these elements, this thesis proposes some approaches to mix offline and online decisions, dealing with the uncertainty coming from renewable production and workload demand. First, we propose four policies for energy compensation. The main objective of these policies is to adapt the offline plan to approximate the storage levels to the planned levels at the end of a time window. These adaptations are necessary since power production and demand can vary. We demonstrate the impact of respecting the storage levels on the Quality of Service (QoS). After that, we introduce Reinforcement Learning algorithms in the compensation problem, trying to improve the QoS of our policies. More specifically, we use these algorithms to define how to compensate for different scenarios, aiming to increase the number of finished jobs. Therefore, we could still respect the energy storage levels and improve the QoS. Finally, our last contribution is a heuristic that mixes both power and scheduling decisions, seeking to reduce the number of killed jobs and wasted energy. This heuristic is named BEASY and uses predictions to make better decisions, maintaining the battery between safe thresholds, which increases the battery's lifetime. BEASY respects the power constraints, having low wasted energy, and the lower number of killed jobs among all algorithms.
Le réchauffement climatique est un des principaux défis de l'humanité. Les combustibles fossiles sont une importante source de production d'énergie dans le monde, entraînant des émissions de gaz à effet de serre (GES) dans l'atmosphère. L'Accord de Paris sur le climat a comme objectif principal de limiter la hausse de température à 2 C, et si possible à 1,5 C. Or, des rapports montrent que l'on se dirige vers une augmentation de 2,8 C. Le secteur des centres de données est un important émetteur de GES, responsable de 1% des émissions mondiales liées à l'énergie. Un moyen de réduire leur impact est de réduire l'énergie nécessaire aux serveurs. Mais, des auteurs signalent une réduction des améliorations énergétiques des processeurs, ce qui, lié à l'augmentation prévue du nombre d'internautes (jusqu'à 5,3 milliards en 2023), tend à aggraver la situation. Une solution serait de faire passer la production d'énergie des combustibles fossiles aux sources vertes (sources d'énergie renouvelables - SER), qui génèrent de l'énergie à partir de sources naturelles, comme l'énergie solaire et éolienne. Le principal inconvénient des SER est leur intermittence, car leur production dépend de la nature. Les grands fournisseurs d'informatique investissent dans la production renouvelable hors site pour fournir au réseau la même proportion d'énergie qu'ils consomment, transférant le problème de l'intermittence à des tiers. Cette thèse se situe dans le cadre du projet Datazero2 qui propose la création d'un centre de données avec une production d'énergie renouvelable sur site, ce qui réduirait considérablement les émissions de GES. Mais un centre de données 100% renouvelable introduit des défis en matière d'énergie et de technologies de l'information. Pour les traiter, on les divise en deux parties : hors ligne et en ligne. La première planifie les décisions à partir des prévisions, prenant en compte le long terme. La partie en ligne applique le plan hors ligne et réagit aux événements réels. Comme les prévisions sont imparfaites, le plan en ligne doit trouver des moyens d'adapter le hors ligne, en réduisant l'impact sur les tâches des utilisateurs. En considérant ces éléments, cette thèse propose des approches pour combiner les décisions hors ligne et en ligne, en traitant l'incertitude de la production renouvelable et de la demande de la charge de travail. Tout d'abord, on propose quatre politiques de compensation énergétique dont l'objectif principal est d'adapter le plan prévu hors ligne pour rapprocher les niveaux de stockage des niveaux prévus à la fin d'une fenêtre temporelle. Ces adaptations sont nécessaires car la production et la demande d'énergie peuvent varier. On montre l'impact du respect des niveaux de stockage sur la qualité de service. Ensuite, on introduit des algorithmes d'apprentissage par renforcement dans le problème de la compensation afin d'améliorer la qualité de service de nos politiques. Ainsi, on utilise ces algorithmes pour définir la compensation des différents scénarios, dans le but d'augmenter le nombre de travaux terminés. En effet, on peut respecter les niveaux de stockage d'énergie tout en améliorant la qualité de service. Enfin, on présente l'heuristique BEASY, qui combine les décisions relatives à la puissance et à l'ordonnancement pour réduire le nombre de tâches abandonnées et le gaspillage d'énergie. Elle utilise des prédictions pour prendre des décisions, en respectant les limites de la batterie pour prolonger sa vie. BEASY respecte les contraintes de puissance, avec un faible gaspillage d'énergie et le plus faible nombre de tâches détruites parmi tous les algorithmes.
Fichier principal
Vignette du fichier
FONTANA_DE_NARDIN_Igor.pdf (4.4 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04361471 , version 1 (22-12-2023)

Identifiants

  • HAL Id : tel-04361471 , version 1

Citer

Igor Fontana de Nardin. Ordonnancement en ligne de tâches IT et engagement de sources dans un centre de calcul alimenté par des énergies renouvelables. Réseaux et télécommunications [cs.NI]. Institut National Polytechnique de Toulouse - INPT, 2023. Français. ⟨NNT : 2023INPT0104⟩. ⟨tel-04361471⟩
154 Consultations
219 Téléchargements

Partager

Gmail Facebook X LinkedIn More