Traitement des données manquantes pour des capteurs de bâtiments connectés
Résumé
The processing the data from smart building is a way to both optimise their energy management and
provide a high level of comfort to the occupants. Because of various possible failures in the data collection process,
the information gathered can be incomplete or incorrect. In such case, so-called data imputation methods should
be used in order to make possible the data processing. This article reviews methods to deal with missing data and
to assess the performance of the imputation. Nine of these methods are applied to the data collected from an indoor
environment-monitoring sensor located in an apartment for which the presence status of the occupant is known.
The methods are compared based on the imputation quality of the multivariate time series as well as based on the
performance of the final classification task, i.e. classifying the occupancy status. For this case study, it turns out
that the performance imputation task has little impact on the performance of the final task.
Le traitement des données issues de bâtiments connectés doit permettre d'optimiser leur gestion énergétique, tout en garantissant un niveau de confort aux occupants. Les données collectées peuvent toutefois être incomplètes du fait de défaillances lors de l'acquisition des mesures. Cela compromet le traitement de l'information. Des méthodes, dites d'imputation, sont alors à appliquer pour consolider les données. Cet article propose un état de l'art sur les méthodes de gestion des données manquantes et d'évaluation de la qualité de l'imputation. Neuf méthodes d'imputation sont ensuite appliquées au cas de données d'ambiance d'un appartement T2, pour lequel le statut de présence de l'occupant est connu. Les méthodes sont comparées, d'une part en étudiant la qualité de l'imputation sur ces séries temporelles multivariées et d'autre part en évaluant la performance des méthodes sur la tâche finale, i.e. la classification du statut de présence. Il ressort de ces comparaisons que la performance de la tâche finale est peu affectée par la performance des méthodes d’imputation dans notre cas.
Origine : Fichiers produits par l'(les) auteur(s)