Générateurs de données météorologiques
Un générateur stochastique de données
météorologiques produit, pour un endroit donné, des
séries chronologiques artificielles de données
météorologiques de longueur illimitée, qui reposent
sur les caractéristiques statistiques des conditions
observées à cet endroit. Ces types de modèles
statistiques sont généralement élaborés en
deux étapes, la première consistant à
modéliser les précipitations quotidiennes, alors que la
deuxième se concentre sur les autres variables
d’intérêt, telles que les températures
minimales et maximales, le rayonnement solaire, l’humidité
et la vitesse du vent, qui sont simulées de manière
conditionnelle selon l’occurrence de la précipitation. Pour
chaque mois, des paramètres différents sont choisis de
façon à refléter les variations saisonnières
à la fois de la valeur des variables proprement dites et de leurs
corrélations croisées (soit dans les rapports entre les
variables individuelles au fil du temps).
Il existe deux types fondamentaux de générateurs
stochastiques - soit le type « Richardson »
(Richardson, 1981; Richardson et Wright, 1984) ou le type « en
série » (Racsko et al., 1991; Semenov et al., 1998).
Les deux types de générateurs de données
météorologiques sont également décrits dans
Wilks et Wilby (1999).
Dans un générateur Richardson (WGEN), l’occurrence
des précipitations est modélisée à
l’aide d’une chaîne de Markov d’ordre 2 qui
décrit généralement deux classes de
précipitations (soit humides soit sèches) et qui ne prend
en compte que l’occurrence des précipitations du jour
précédent. Des modèles plus complexes peuvent faire
intervenir plus d’une classe de précipitations (soit des
quantités faibles, moyennes et élevées), ainsi que
l’occurrence des précipitations sur un certain nombre de
jours avant le jour courant, plutôt que seulement la veille. La
méthode de Markov fournit des informations sur les
probabilités de transition (p. ex. sur la probabilité
qu’un jour humide suive un jour sec ou sur la probabilité
qu’un jour humide suive un jour humide) calculées à
partir des données d’observation de la station. Si des
précipitations surviennent, alors la quantité tombée
les jours humides est généralement déterminée
à l’aide d’une distribution de fréquence
définie au préalable, le plus fréquemment la
distribution gamma, quoique des distributions exponentielles mixtes
permettent une meilleure représentation de la quantité des
précipitations à certains endroits. Les autres variables
climatiques sont alors calculées en fonction de leurs
corrélations les unes avec les autres et du statut humide ou sec
de chaque jour.
L’un des principaux reproches que l’on adresse aux
générateurs est leur incapacité à donner avec
précision la durée des séries humides ou
sèches (c.-à-d. les phénomènes persistants
comme les sécheresses ou les pluies prolongées) qui
revêtent une extrême importance pour certaines applications
(p. ex. l’agriculture, où l’occurrence
d’une sécheresse à un stade particulier du
développement de la récolte peut conduire à sa
perte). L’approche en série pour la génération
des conditions météorologiques a été mise au
point pour tenter de pallier ce problème. Dans le
générateur de type en série, la première
étape du processus consiste à modéliser des
séries de jours secs et humides. La quantité de
précipitations et les variables climatiques restantes sont alors
générées en fonction des séries humides ou
sèches. Ce type de générateur, tout d’abord
mis au point par Racsko et al. (1991), a été
amélioré de façon considérable (LARS-WG;
Semenov et al., 1998) et le logiciel est aujourd’hui disponible
gratuitement.
Ce LARS-WG se fonde toujours sur la modélisation initiale des
séries humides et sèches mais, pour cela, il fait appel
à des distributions semi-empiriques plutôt qu’aux
distributions prédéfinies utilisées dans la version
précédente décrite par Racsko et al. (1991). Cela
signifie que chaque observation unique de l’enregistrement
quotidien de la station est utilisée dans le processus de
modélisation; on pourrait dès lors s’attendre
à ce que ce générateur ait
généralement une meilleure performance que celui qui repose
sur l’adaptabilité d’une distribution
prédéfinie par rapport aux données
d’observation de la station. Les performances de LARS-WG et du WGEN
ont été comparées sous divers climats par Semenov et
al. (1998).
Les deux types de générateurs de données
météorologiques exigent une calibration initiale en
fonction des données d’observation de la station. Le
processus de calibration génère un fichier de
paramètres contenant des informations sur les
caractéristiques statistiques des données
d’observation, qui sont ensuite utilisées pour
générer des séries de données
synthétiques. On peut utiliser les données d’une
période de n’importe quelle durée pour calibrer le
générateur, mais il faut disposer d’au moins
10 années de données, voire plus dans le cas de
climats hautement variables. S’il est important de modéliser
des phénomènes peu fréquents et de grande
intensité, il faut utiliser la série la plus longue
possible lors du processus de calibration. Les générateurs
peuvent uniquement simuler des phénomènes à partir
de la série de données sur la période de
calibration, et ils sont incapables de simuler des
phénomènes qui ne sont pas inclus dans cette série
de données.
La vérification du modèle se fait
généralement en comparant les statistiques des
données artificielles à celles de la série de
données d’observation utilisées pour la calibration.
Les deux types de générateurs présentent un
problème : ils tendent à sous-estimer la
variabilité des séries chronologiques d’observations.
Cela tient à la façon dont les différentes variables
climatiques sont modélisées p. ex. on utilise des
séries de Fourier pour lisser les caractéristiques
statistiques - c.-à-d. les moyennes et les écarts
types - des variables climatiques autres que les
précipitations pour les jours humides et les jours secs, de sorte
qu’une baisse de la variabilité est immédiatement
introduite.
En plus d’être capables de générer des
séries chronologiques de durée presque infinie de
données météorologiques quotidiennes
(généralement limitées uniquement par les ressources
informatiques) en fonction des données statistiques de
l’enregistrement d’une station d’observation, les
générateurs stochastiques servent aussi à
générer des séries chronologiques
synthétiques dans des régions pour lesquelles il existe peu
de données. Le générateur peut être
utilisé à un certain nombre de stations dans une
région donnée, et on produit un fichier de
paramètres pour chaque station. Ces paramètres peuvent
ensuite être interpolés dans l’espace et
utilisés dans un endroit pour lequel on ne dispose pas de
données d’observation. Cela permet de générer
des données synthétiques pour cet endroit. Plus on pourra
utiliser de stations avec le générateur pour une
région donnée, plus les paramètres
dérivés de l’interpolation seront fiables, de
même que les caractéristiques statistiques des
données synthétiques. La génération de
données synthétiques dans les régions où les
données sont rares n’est généralement
recommandée que lorsque le climat régional est relativement
uniforme.
Les générateurs stochastiques servent principalement
à générer des données
météorologiques quotidiennes pour les scénarios de
changements climatiques. La plupart de ces scénarios correspondent
à des changements mensuels par rapport à une période
de référence particulière (actuellement de 1961
à 1990), tandis que nombre d’applications liées aux
répercussions exigent des données quotidiennes. À
l’heure actuelle, les sorties de données quotidiennes des
MCG sont peu fiables, en particulier pour ces applications. Il est
toutefois possible de dériver des données quotidiennes des
informations mensuelles issues de scénarios de MCG en perturbant
les fichiers de paramètres des générateurs de
données météorologiques par les changements mensuels
du scénario (p. ex., un scénario particulier peut
indiquer une élévation de la température moyenne de
2,4°C en janvier - cette valeur est alors ajoutée
à la température moyenne du mois de janvier contenue dans
le fichier des paramètres). Selon les composantes statistiques
utilisées pour décrire le climat d’un endroit
donné, on peut aussi y incorporer les changements dans la
variabilité du climat ainsi que les changements des valeurs
moyennes. Wilks (1992) décrit une méthode pour utiliser les
scénarios de changements climatiques avec le
générateur WGEN (alors qu’une version de ce type de
générateur n’est généralement pas
disponible). Par contre, LARS-WG a été
élaboré en fonction des études sur les changements
climatiques, et il suffit d’apporter des changements à un
fichier de scénario, déjà inclus dans le
générateur, pour pouvoir générer des
données météorologiques quotidiennes pour un
scénario donné de changements climatiques issu des
informations mensuelles de MCG.
Références
Racsko, P., L. Szeidl and M.A. Semenov (1991): A serial approach to local stochastic weather models. Ecological Modelling 57: 27-41.
Richardson, C.W. (1981): Stochastic simulation of daily precipitation, temperature and solar radiation. Water Resources Research 17: 182-190.
Richardson, C.W. and D.A. Wright (1984): WGEN: a model for generating daily weather variables. US Department of Agriculture, Agricultural Research Service, ARS-8, 83 pp.
Semenov, M.A., R.J. Brooks, E.M. Barrow and C.W. Richardson (1998): Comparison of WGEN and LARS-WG stochastic weather generators for diverse climates. Climate Research 10: 95-107.
Wilks, D.S. (1992): Adapting stochastic weather generation algorithms for climate change studies. Climatic Change 22: 67-84.
Wilks, D.S. and R.L. Wilby (1999): The weather generation game: a review of stochastic weather models. Progress in Physical Geography 23: 329-357.


