Générateurs de données météorologiques

Un générateur stochastique de données météorologiques produit, pour un endroit donné, des séries chronologiques artificielles de données météorologiques de longueur illimitée, qui reposent sur les caractéristiques statistiques des conditions observées à cet endroit. Ces types de modèles statistiques sont généralement élaborés en deux étapes, la première consistant à modéliser les précipitations quotidiennes, alors que la deuxième se concentre sur les autres variables d’intérêt, telles que les températures minimales et maximales, le rayonnement solaire, l’humidité et la vitesse du vent, qui sont simulées de manière conditionnelle selon l’occurrence de la précipitation. Pour chaque mois, des paramètres différents sont choisis de façon à refléter les variations saisonnières à la fois de la valeur des variables proprement dites et de leurs corrélations croisées (soit dans les rapports entre les variables individuelles au fil du temps).

Il existe deux types fondamentaux de générateurs stochastiques - soit le type « Richardson » (Richardson, 1981; Richardson et Wright, 1984) ou le type « en série » (Racsko et al., 1991; Semenov et al., 1998). Les deux types de générateurs de données météorologiques sont également décrits dans Wilks et Wilby (1999).

Dans un générateur Richardson (WGEN), l’occurrence des précipitations est modélisée à l’aide d’une chaîne de Markov d’ordre 2 qui décrit généralement deux classes de précipitations (soit humides soit sèches) et qui ne prend en compte que l’occurrence des précipitations du jour précédent. Des modèles plus complexes peuvent faire intervenir plus d’une classe de précipitations (soit des quantités faibles, moyennes et élevées), ainsi que l’occurrence des précipitations sur un certain nombre de jours avant le jour courant, plutôt que seulement la veille. La méthode de Markov fournit des informations sur les probabilités de transition (p. ex. sur la probabilité qu’un jour humide suive un jour sec ou sur la probabilité qu’un jour humide suive un jour humide) calculées à partir des données d’observation de la station. Si des précipitations surviennent, alors la quantité tombée les jours humides est généralement déterminée à l’aide d’une distribution de fréquence définie au préalable, le plus fréquemment la distribution gamma, quoique des distributions exponentielles mixtes permettent une meilleure représentation de la quantité des précipitations à certains endroits. Les autres variables climatiques sont alors calculées en fonction de leurs corrélations les unes avec les autres et du statut humide ou sec de chaque jour.

L’un des principaux reproches que l’on adresse aux générateurs est leur incapacité à donner avec précision la durée des séries humides ou sèches (c.-à-d. les phénomènes persistants comme les sécheresses ou les pluies prolongées) qui revêtent une extrême importance pour certaines applications (p. ex. l’agriculture, où l’occurrence d’une sécheresse à un stade particulier du développement de la récolte peut conduire à sa perte). L’approche en série pour la génération des conditions météorologiques a été mise au point pour tenter de pallier ce problème. Dans le générateur de type en série, la première étape du processus consiste à modéliser des séries de jours secs et humides. La quantité de précipitations et les variables climatiques restantes sont alors générées en fonction des séries humides ou sèches. Ce type de générateur, tout d’abord mis au point par Racsko et al. (1991), a été amélioré de façon considérable (LARS-WG; Semenov et al., 1998) et le logiciel est aujourd’hui disponible gratuitement.

Ce LARS-WG se fonde toujours sur la modélisation initiale des séries humides et sèches mais, pour cela, il fait appel à des distributions semi-empiriques plutôt qu’aux distributions prédéfinies utilisées dans la version précédente décrite par Racsko et al. (1991). Cela signifie que chaque observation unique de l’enregistrement quotidien de la station est utilisée dans le processus de modélisation; on pourrait dès lors s’attendre à ce que ce générateur ait généralement une meilleure performance que celui qui repose sur l’adaptabilité d’une distribution prédéfinie par rapport aux données d’observation de la station. Les performances de LARS-WG et du WGEN ont été comparées sous divers climats par Semenov et al. (1998).

Les deux types de générateurs de données météorologiques exigent une calibration initiale en fonction des données d’observation de la station. Le processus de calibration génère un fichier de paramètres contenant des informations sur les caractéristiques statistiques des données d’observation, qui sont ensuite utilisées pour générer des séries de données synthétiques. On peut utiliser les données d’une période de n’importe quelle durée pour calibrer le générateur, mais il faut disposer d’au moins 10 années de données, voire plus dans le cas de climats hautement variables. S’il est important de modéliser des phénomènes peu fréquents et de grande intensité, il faut utiliser la série la plus longue possible lors du processus de calibration. Les générateurs peuvent uniquement simuler des phénomènes à partir de la série de données sur la période de calibration, et ils sont incapables de simuler des phénomènes qui ne sont pas inclus dans cette série de données.

La vérification du modèle se fait généralement en comparant les statistiques des données artificielles à celles de la série de données d’observation utilisées pour la calibration. Les deux types de générateurs présentent un problème : ils tendent à sous-estimer la variabilité des séries chronologiques d’observations. Cela tient à la façon dont les différentes variables climatiques sont modélisées p. ex. on utilise des séries de Fourier pour lisser les caractéristiques statistiques - c.-à-d. les moyennes et les écarts types - des variables climatiques autres que les précipitations pour les jours humides et les jours secs, de sorte qu’une baisse de la variabilité est immédiatement introduite.

En plus d’être capables de générer des séries chronologiques de durée presque infinie de données météorologiques quotidiennes (généralement limitées uniquement par les ressources informatiques) en fonction des données statistiques de l’enregistrement d’une station d’observation, les générateurs stochastiques servent aussi à générer des séries chronologiques synthétiques dans des régions pour lesquelles il existe peu de données. Le générateur peut être utilisé à un certain nombre de stations dans une région donnée, et on produit un fichier de paramètres pour chaque station. Ces paramètres peuvent ensuite être interpolés dans l’espace et utilisés dans un endroit pour lequel on ne dispose pas de données d’observation. Cela permet de générer des données synthétiques pour cet endroit. Plus on pourra utiliser de stations avec le générateur pour une région donnée, plus les paramètres dérivés de l’interpolation seront fiables, de même que les caractéristiques statistiques des données synthétiques. La génération de données synthétiques dans les régions où les données sont rares n’est généralement recommandée que lorsque le climat régional est relativement uniforme.

Les générateurs stochastiques servent principalement à générer des données météorologiques quotidiennes pour les scénarios de changements climatiques. La plupart de ces scénarios correspondent à des changements mensuels par rapport à une période de référence particulière (actuellement de 1961 à 1990), tandis que nombre d’applications liées aux répercussions exigent des données quotidiennes. À l’heure actuelle, les sorties de données quotidiennes des MCG sont peu fiables, en particulier pour ces applications. Il est toutefois possible de dériver des données quotidiennes des informations mensuelles issues de scénarios de MCG en perturbant les fichiers de paramètres des générateurs de données météorologiques par les changements mensuels du scénario (p. ex., un scénario particulier peut indiquer une élévation de la température moyenne de 2,4°C en janvier - cette valeur est alors ajoutée à la température moyenne du mois de janvier contenue dans le fichier des paramètres). Selon les composantes statistiques utilisées pour décrire le climat d’un endroit donné, on peut aussi y incorporer les changements dans la variabilité du climat ainsi que les changements des valeurs moyennes. Wilks (1992) décrit une méthode pour utiliser les scénarios de changements climatiques avec le générateur WGEN (alors qu’une version de ce type de générateur n’est généralement pas disponible). Par contre, LARS-WG a été élaboré en fonction des études sur les changements climatiques, et il suffit d’apporter des changements à un fichier de scénario, déjà inclus dans le générateur, pour pouvoir générer des données météorologiques quotidiennes pour un scénario donné de changements climatiques issu des informations mensuelles de MCG.

Haute de la page

Références

Racsko, P., L. Szeidl and M.A. Semenov (1991): A serial approach to local stochastic weather models. Ecological Modelling 57: 27-41.

Richardson, C.W. (1981): Stochastic simulation of daily precipitation, temperature and solar radiation. Water Resources Research 17: 182-190.

Richardson, C.W. and D.A. Wright (1984): WGEN: a model for generating daily weather variables. US Department of Agriculture, Agricultural Research Service, ARS-8, 83 pp.

Semenov, M.A., R.J. Brooks, E.M. Barrow and C.W. Richardson (1998): Comparison of WGEN and LARS-WG stochastic weather generators for diverse climates. Climate Research 10: 95-107.

Wilks, D.S. (1992): Adapting stochastic weather generation algorithms for climate change studies. Climatic Change 22: 67-84.

Wilks, D.S. and R.L. Wilby (1999): The weather generation game: a review of stochastic weather models. Progress in Physical Geography 23: 329-357.

Haute de la page

Dernière mise à jour: 22 juillet 2010 15:43:47


Haut de la Page