• Benvenuti nel nuovo forum di Meteodue.it

Sul concetto di clima e normalità climatica

Messaggi
16
Reazioni
0
Punteggio
0
Località
Montecchio Emilia (RE)
E' con piacere che scrivo il mio primo intervento in questo forum e come preannunciato nella sezione di presentazione ci tengo a farlo con un mio piccolo contributo inerente una questione che reputo di fondamentale importanza in Climatologia Statistica, il concetto di clima e di normalità climatica.

Il presente lavoro amatoriale vuole contribuire alla riflessione ed aprire al dialogo circa questioni che ancora tutt'oggi vengono affrontate, anche con il nulla osta del WMO, in via meramente convenzionale. E mi riferisco all'utilizzo del periodo trentennale di riferimento e della relativa media trentennale ai fini della definizione di normalità climatica (Cli.no.). Non soddisfatto di questa impostazione dogmatica ho voluto mettere nero su bianco il modello teorico che da alcuni anni ho nella testa circa le questioni di cui all'oggetto.

Il documento è quasi interamente redatto affrontando i ragionamenti in via descrittiva e rimanda a due appendici finali l'approfondimento metodologico adottato nel caso specifico dell'esempio proposto e l'illustrazione in estrema sintesi della metodologia inferenziale che è alla base del costrutto teorico complessivo.

Mi rendo conto che il documento potrà apparire in certi aspetti noioso e tecnico ma credetemi che ho cercato di fare il possibile per renderlo intellegibile a tutti rimandando appunto alle appendici per gli approfondimenti del caso.

Ci tengo a sottolineare il fatto relativo alla decisione di postarlo su questo forum maturata in considerazione dei contenuti di elevata qualità postati negli anni e dello spirito di ricerca e innovazione che lo contraddistingue rispetto ad altre realtà virtuali.

Tenete sempre presente che non possiedo i titoli per approcciare a questioni climatologiche in modo professionale pertanto il presente lavoro rimane confinato all'ambito della passione meteorologica, climatologica e soprattutto statistica che mi appartiene.

Che altro dire ... nella speranza di non annoiarvi e di non aver scritto bestialità, vi auguro una buona lettura e rimango a disposizione per un confronto sui contenuti. Accetto di tutto, considerazioni, opinioni, suggerimenti e soprattutto critiche.



Ciao!
 
C

Cloover

Guest
Lorenzo Smeraldi ha detto:
E' con piacere che scrivo il mio primo intervento in questo forum e come preannunciato nella sezione di presentazione ci tengo a farlo con un mio piccolo contributo inerente una questione che reputo di fondamentale importanza in Climatologia Statistica, il concetto di clima e di normalità climatica.

Il presente lavoro amatoriale vuole contribuire alla riflessione ed aprire al dialogo circa questioni che ancora tutt'oggi vengono affrontate, anche con il nulla osta del WMO, in via meramente convenzionale. E mi riferisco all'utilizzo del periodo trentennale di riferimento e della relativa media trentennale ai fini della definizione di normalità climatica (Cli.no.). Non soddsifatto di questa impostazione dogmatica ho voluto mettere nero su bianco il modello teorico che da alcuni anni ho nella testa circa le questioni di cui all'oggetto.

Il documento è quasi interamente redatto affrontando i ragionamenti in via descrittiva e rimanda a due appendici finali l'approfondimento metodologico adottato nel caso specifico dell'esempio proposto e l'illustrazione in estrema sintesi della metodologia inferenziale che è alla base del costrutto teorico complessivo.

Mi rendo conto che il documento potrà apparire in certi aspetti noioso e tecnico ma credetemi che ho cercato di fare il possibile per renderlo intellegibile a tutti rimandando appunto alle appendici per gli approfondimenti del caso.

Ci tengo a sottolineare il fatto relativo alla decisione di postarlo su questo forum maturata in considerazione dei contenuti di elevata qualità postati negli anni e dello spirito di ricerca e innovazione che lo contraddistinuge rispetto ad altre realtà virtuali.

Tenete sempre presente che non possiedo i titoli per approciare a questioni climatologiche in modo professionale pertanto il presente lavoro rimane confinato all'ambito della passione meteorologica, climatologica e soprattutto statistica che mi appartiene.

Che altro dire ... nella speranza di non annoiarvi e di non aver scritto bestialità, vi auguro una buona lettura e rimango a disposizione per un confronto sui contenuti. Accetto di tutto, considerazioni, opinioni, suggerimenti e soprattutto critiche.



Ciao!


Accipicchia Lorenzo! Hai fatto davvero un lavorone.... I complimenti te li faccio subito perchè capisco perfettamente quanto tempo e quanto sacrificio richieda cimentarsi in questo tipo di analisi. Riguardo i contenuti è un testo che richiede una lettura approfondita, tra l'altro in riferimento ad un argomento "scottante" ed attuale... Sarò quindi lieto di esprimere le mie considerazioni in merito quanto prima.
Un salutone

Filippo
 
Messaggi
16
Reazioni
0
Punteggio
0
Località
Montecchio Emilia (RE)
Provo a “rompere il ghiaccio”  :) facendo qualche riflessione aggiuntiva circa il modello teorico presentato che rappresenta, evidentemente, una primissima astrazione costruita su delle basi di natura inferenziale che si prestano a sviluppi successivi maggiormente complessi e notevolmente più “robusti” dal punto di vista statistico.

Quando si parla di campioni statistici, non si può sottovalutare l’aspetto riguardante il concetto d’indipendenza. Un campione, per essere definito tale, deve essere realizzato in modo del tutto casuale e anche gli elementi (osservazioni) che lo compongono devono essere gli uni indipendenti dagli altri. Pertanto, quando si definisce il periodo trentennale, una singola osservazione climatica, cioè campione di uno stato climatico, devono essere soddisfatte le seguenti assunzioni teoriche:

1) il blocco trentennale deve essere un sottoinsieme casuale dello stato climatico di riferimento e, per essere tale

2) deve essere formato da  singole osservazioni tra di loro indipendenti

Nella realtà accade sovente che nel corso dei trent’anni di osservazione climatica la variabilità del tempo atmosferico faccia degli scherzetti che statisticamente possono risultare sgraditi. Se esiste una certa persistenza in determinati fattori climatici, e così è, allora il fatto di osservare eventi temporalmente consecutivi, in successione,  che presentano una certa somiglianza non è poi così improbabile e questo fattore di autocorrelazione seriale mina sia l’indipendenza delle singole osservazioni sia la casualità stessa del campione. Ciò comporta che le procedure inferenziali adottate in questo contesto non presentano quel grado di potenza che generalmente è loro attribuito nello stimare parametri e testare la validità di certe ipotesi.

Semplificare la questione trattando come teoricamente casuale un campione che potrebbe non esserlo nella realtà, può produrre delle distorsioni e alterazioni nei valori stimati che in prima istanza possono essere considerate accettabili data l’utilità pratica nel supporre vere queste assunzioni ai fini di una modellazione generale del problema oggetto di studio, nello specifico la definizione di clima e del concetto derivato di normalità climatica. E’ del tutto evidente che la questione deve essere comunque ripresa per affinare il costrutto teorico sulla base della violazione delle ipotesi citate. E questo può avvenire, ad esempio, attraverso le tecniche statistiche del ricampionamento (bootstrap)  che permettono essenzialmente di superare i limiti di un approccio parametrico (basato su determinate assunzioni) verso un approccio di tipo non parametrico (basato sull’assenza di tale assunzioni).

La tecnica del ricampionamento, tra l’altro, permette anche di superare un ulteriore limite/assunzione che è alla base delle tecniche inferenziali adottate nello studio, la normalità della distribuzione di probabilità della popolazione. In climatologia, con riferimento alla temperatura dell’aria, è spesso conveniente accettare che la distribuzione di frequenza/probabilità di tale variabile approssima una gaussiana. Quest’assunzione è ritenuta vera ma personalmente ritengo opportuno ritenerla piuttosto verosimile. Poiché possiamo affermare che il campo termico si distribuisce normalmente esclusivamente in funzione dell’osservazione di campioni (trentenni, cinquantenni, secoli di osservazioni) non possiamo eliminare “tout court” la presenza di un grado d’indeterminazione nell’affermare questo fatto. In sostanza, in riferimento alla popolazione, il campo termico approssima una gaussiana? Lato pratico, vista la conferma proveniente dai dati empirici, è conveniente accettare come vera l’assunzione poiché questa caratteristica agevola enormemente nell’applicazione pratica l’utilizzo delle tecniche statistiche di riferimento, esiste cioè un’utilità pratica a questa semplificazione. La tecnica del ricampionamento non richiede la verità dell’assunzione della normalità della popolazione di riferimento.

Infine, nell’analisi delle serie storiche, le procedure inferenziale richiedono anche la stazionarietà della serie in varianza (omoschedasticità) che in presenza di trend lineare è facilmente violata. Anche in questo caso metodologie di tipo non parametrico possono venire in aiuto per approcciare in modo maggiormente corretto le questioni riguardanti le problematiche climatiche, anche quelle analizzate nello studio.

Tutto questo per dire che l'analisi statistica dei dati climatologici è cosa complessa già a partire dalla questione base di tutta la statistica climatologica, il concetto di clima e normalità climatica. Quando il grado di approfondimento delle analisi si complica, ad esempio nella stima di un trend, nella quantificazione di una correlazione, nella modellazione di una relazione tra variabili, ecc ..., queste problematiche si amplificano dal momento che l'utilizzo che viene fatto di queste analisi non è esclusivamente descrittivo, di spiegazione delle dinamiche sottostanti, ma anche di tipo previsionale, e qui son dolori se le assunzioni di base sono sistematicamente violate.

Ciao!
 

Stevesylvester

Utente esperto
MD GROUP
Messaggi
9,245
Reazioni
4,194
Punteggio
113
Località
San Giovanni V.no (AR) (ma Grossetano)
Lorenzo Smeraldi ha detto:
...............Tutto questo per dire che l'analisi statistica dei dati climatologici è cosa complessa già a partire dalla questione base di tutta la statistica climatologica, il concetto di clima e normalità climatica. Quando il grado di approfondimento delle analisi si complica, ad esempio nella stima di un trend, nella quantificazione di una correlazione, nella modellazione di una relazione tra variabili, ecc ..., queste problematiche si amplificano dal momento che l'utilizzo che viene fatto di queste analisi non è esclusivamente descrittivo, di spiegazione delle dinamiche sottostanti, ma anche di tipo previsionale, e qui son dolori se le assunzioni di base sono sistematicamente violate..................
Troppo complessa la materia per le mie conoscenze e quindi non sono in grado di discuterne tecnicamente in modo costruttivo. Ma la parte che ho riportato e' comunque chiaramente incontrovertibile specie nelle conclusioni anzi: per la meteo siamo in un caso specifico di principio valido in assoluto.
 
Messaggi
16
Reazioni
0
Punteggio
0
Località
Montecchio Emilia (RE)
Mi rendo perfettamente conto che la Climatologia statistica è una materia di nicchia che raggiunge pochi meteo appassionati per vari motivi, i principali, la non familiarità/passione con/per la Statistica.

A tal fine ho predisposto, sempre a livello amatoriale (ci tengo a precisarlo perché potrei aver scritto delle inesattezze), una sintesi della teoria della probabilità sottostante all'analisi delle serie storiche, riconducibile al documento postato in apertura di questo thread.

L'obiettivo è di rendere più comprensibile cosa c'e', di teorico, dietro a quel lavoro e di avvicinare qualche interessato all'approfondimento delle questioni dal momento che sono sempre disponibile a discutere ed eventualmente aiutare chi volesse intraprendere un percorso di studio di questa materia.


https://drive.google.com/file/d/0B4VvNkswSPPoVzRxaEVFSW9SV3M/view?usp=sharing[/url
 

Napo

Utente attivo
Messaggi
28
Reazioni
6
Punteggio
3
Località
Milano / Trento (nei weekend)
Lorenzo Smeraldi ha detto:
1) il blocco trentennale deve essere un sottoinsieme casuale dello stato climatico di riferimento e, per essere tale

2) deve essere formato da  singole osservazioni tra di loro indipendenti

Proseguo nella rottura del ghiaccio con alcune considerazioni generali che mi pare possano aggiungere qualche cosa in termini di background generale.

Una cosa mi pare certa.
Nessuna di queste due condizioni è soddisfatta nelle serie delle temperature.
In particolare la scelta del periodo di riferimento è sempre basata su fattori (diversi per ogni provider di dati) che possono essere giustificati dal punti di vista tecnico (ad esempio la qualità presunta delle rilevazioni) ma non sono giustificati dal punti di vista statistico.

Il problema delle osservazioni indipendenti è anche più difficile da superare. Come ampiamente suggerito da numerosi studi sulla qualità delle stazioni di rilevamento gli errori di misurazione secondari a problemi di calibrazione o di modifica delle condizioni ambientali circostanti le singole stazioni meteo possono avere introdotto bias che si propaganano nel tempo e che quindi rendono le misuraioni non indipendenti per definizione.

Infine vorrei sottolineare che il concetto di "periodo di riferimento" non ha una grande logica dal punto di vista climatico dato che il sistema è in continuo cambiamento. SI tratta di fatto di un artifizio introdotto per poter esperimere i dati in termini di "anomalia" ed eliminare così i valori assoluti delle tempereature per meglio "nomogeneizzare" i dati.... whatever that means.....

Magari utilizzare un resampling nelle serie delle temperature assolute e non delle anomalie potrebbe dare risultati ancora diversi.

Gran bel levoro , complimentoni.... ::)
ciao
Carlo
 
Messaggi
16
Reazioni
0
Punteggio
0
Località
Montecchio Emilia (RE)
Ciao Carlo,

innanzitutto grazie per il contributo alla discussione e provo ad approfondire le questioni sulla base degli spunti di riflessione che hai fornito.

Napo ha detto:
In particolare la scelta del periodo di riferimento è sempre basata su fattori (diversi per ogni provider di dati) che possono essere giustificati dal punti di vista tecnico (ad esempio la qualità presunta delle rilevazioni) ma non sono giustificati dal punti di vista statistico.

Napo ha detto:
Infine vorrei sottolineare che il concetto di "periodo di riferimento" non ha una grande logica dal punto di vista climatico dato che il sistema è in continuo cambiamento. SI tratta di fatto di un artifizio introdotto per poter esprimere i dati in termini di "anomalia" ed eliminare così i valori assoluti delle temperature per meglio "nomogeneizzare" i dati.... whatever that means.....

Come giustamente osservi, il periodo di riferimento così come è costruito oggi sulla base di convenzioni è giustificato esclusivamente da un punto di vista tecnico, pertanto, come sottolineo nel mio documento, una convenzione di questo tipo non può essere utilizzata per la definizione di clima e normalità climatica, ma esclusivamente in riferimento ad una standardizzazione massiva delle serie storiche per agevolare confronti spaziali in termini di anomalia.

Tra l’altro anche il criterio utilizzato nella costruzione delle anomalie da parte dei vari providers di dati personalmente lo ritengo assolutamente “imbarazzante”. Se non sbaglio, l’anomalia è semplicemente costruita come scarto del valore puntuale rispetto alla media trentennale di riferimento cosicché uno scarto di 3° C dalla media di riferimento assume lo stesso peso in ogni tipologia climatica … ad esempio, 3°C di scostamento positivo su una media mensile di una località subpolare ha lo stesso peso di uno scostamento positivo di 3°C di una località equatoriale. Questo metodo non permette confronti omogenei a livello spaziale poiché non tiene conto della variabilità climatica. Un’anomalia corretta dovrebbe essere standardizzata, ad esempio rispetto alla deviazione standard. In sostanza, una mappa del genere

http://www.metoffice.gov.uk/hadobs/crutem4/data/web_figures/anomalies.png

a me fa  ;D

In caso non sia un semplice scarto, mi scuso in anticipo!

Napo ha detto:
Nessuna di queste due condizioni è soddisfatta nelle serie delle temperature.

Napo ha detto:
Il problema delle osservazioni indipendenti è anche più difficile da superare. Come ampiamente suggerito da numerosi studi sulla qualità delle stazioni di rilevamento gli errori di misurazione secondari a problemi di calibrazione o di modifica delle condizioni ambientali circostanti le singole stazioni meteo possono avere introdotto bias che si propagano nel tempo e che quindi rendono le misurazioni non indipendenti per definizione.

Di sicuro, stabilire un periodo di riferimento in modo convenzionale, non rappresenta di certo un campionamento di tipo casuale pertanto, in questo contesto, la problematica della indipendenza del campione è presente.

Identificare, partendo da differenti periodi trentennali, uno stato climatico, come da me proposto, presenta l’indubbio vantaggio che, una volta delimitato l’arco temporale in cui è presente discontinuità climatica, è possibile costruire i parametri rappresentativi di quei precisi stati climatici, costruzione che può avvenire semplicemente calcolando media e deviazione standard sull’intero dominio temporale dello stato climatico oppure, come suggerisci:

Napo ha detto:
Magari utilizzare un resampling nelle serie delle temperature

tramite ricampionamento casuale (bootstrap) all’interno dello stato climatico. Prova ad immaginare una situazione dove:

• dall’anno 1 all’anno 50 esiste un determinato stato climatico (S1)
• poi dall’anno 51 all’anno 80 esiste uno stato climatico più caldo (S2)
• poi dall’anno 81 all’anno 130 si torna allo stato climatico (S1)
• e ancora dall’anno 131 all’anno 160 si passa di nuovo allo stato climatico (S2)

Ora ipotizza che nell’anno 175 ti accorgi che il clima sta degenerando nuovamente verso lo stato climatico S1, a questo punto puoi fare inferenza statistica ricampionando casualmente i valori dei periodi (1-50 e 81-130) e descrivere in modo statisticamente significativo il clima attuale al periodo 175 e fare ipotesi statistiche sul futuro.

Tutto questo, con un sistema in via convenzionale, ti è precluso.

Per quanto riguarda l’indipendenza tra valori del campione quanto osservi è un problema reale legato alla presenza di errore sistematico (e non solo accidentale, trascurabile) che è in grado di modificare, lungo l’intero dominio temporale della serie storica, il valore assoluto dei dati puntuali. L’errore sistematico influenza il valore puntuale, quindi la media, ad esempio, ma lascia inalterato il trend deterministico dal momento che si propaga linearmente, eventualmente in modo amplificato, influenzando la varianza.

Generalmente questo tipo di disomogeneità è in parte filtrabile ed eliminabile per via statistica anche se sono del parere che rettificare le serie storiche può talvolta introdurre nuovi bias, pertanto non è detto che sia sempre un atteggiamento virtuoso. Ad ogni modo, le serie omogenizzate che abbiamo a disposizione rappresentano l’unica informazione disponibile.

Il tipo d’indipendenza tra valori a cui mi riferivo io è legata al fenomeno della persistenza del tempo atmosferico che può condizionare gli eventi che si manifestano ad istanti successivi contigui. Si parla di autocorrelazione e questa caratteristica influisce sul tipo di analisi statistica da adottare. 
 

Napo

Utente attivo
Messaggi
28
Reazioni
6
Punteggio
3
Località
Milano / Trento (nei weekend)
Lorenzo Smeraldi ha detto:
Un’anomalia corretta dovrebbe essere standardizzata, ad esempio rispetto alla deviazione standard. In sostanza, una mappa del genere

http://www.metoffice.gov.uk/hadobs/crutem4/data/web_figures/anomalies.png

a me fa  ;D

Caro Lorenzo
Su questo non ci piove  ;)

Lorenzo Smeraldi ha detto:
“Identificare, partendo da differenti periodi trentennali, uno stato climatico, come da me proposto, presenta l’indubbio vantaggio che, una volta delimitato l’arco temporale in cui è presente discontinuità climatica, è possibile costruire i parametri rappresentativi di quei precisi stati climatici, costruzione che può avvenire semplicemente calcolando media e deviazione standard sull’intero dominio temporale dello stato climatico oppure, come suggerisci…….”

Senza dubbio ipotizzando che si riesca a costruire un modello predittivo “adattabile” al variare delle condizioni  che determinano gli stati climatici l’accuratezza diagnostica a prognostica (o per dirla in termini climatici "hindcast" e "forecast" ..... scusate 30 anni di ricerca in campo biomedico lasciano il segno nella temrminologia .. :)) )  ne gioverebbe grandemente.

Lorenzo Smeraldi ha detto:
Il tipo d’indipendenza tra valori a cui mi riferivo io è legata al fenomeno della persistenza del tempo atmosferico che può condizionare gli eventi che si manifestano ad istanti successivi contigui. Si parla di autocorrelazione e questa caratteristica influisce sul tipo di analisi statistica da adottare.

Certamente uscire “puliti” da sistemi largamente autocorrelati non è facile (l’ho imparato a mie spese cercando si sviluppare algoritmi predittivi su serie di osservazioni retrospettiche in ambito clinico).  Anche se conosco davvero poco l’approccio statistico utilizzato nei modelli matematici in ambito climatologico (ne ho già abbastanza da studiare delle mie robe), se l’esperienza non mi inganna, penso  che la modesta performance dei modelli IPCC nella predizione dell’andamento delle temperature globali sia proprio dovuto alla sottovalutazione dei cambiamenti dello stato climatico, e quindi ad una scadente gestione delle autocorrelazioni.

Tutto sta vedere se si riesce a dare una definizione precisa del concetto di “stato climatico” e sopratutto delle variabili che determinano le transizioni di stato. Credo che questo sia un punto fondamentale

Ancora complimenti a te per il coraggio di percorrere una strada alternative ed originale, non facile per come va il mondo della ricerca di questi tempi.

Buona serata a tutti

Carlo
 
Top