elementi di statistica descrittivaPer DISTRIBUZIONI UNIVARIATe
1.12. ESERCIZI SULLE MISURE DI TENDENZA CENTRALE, DISPERSIONE, SIMMETRIA E CURTOSI
ESEMPIO 1. In 36 laghi degli Appennini Settentrionali è stato prelevato un campione d’acqua e sono state misurate le concentrazioni di Sodio e di Cloruri, espresse in mg/l, (vedi tabella seguente):
Calcolare le misure della tendenza centrale, della variabilità e degli indici di forma; - rappresentare graficamente i dati in istogrammi.
Risposta. Le statistiche calcolate dai programmi informatici comprendono varie misure di tendenza centrale, di dispersione, di simmetria e di curtosi. Quelle di seguito riportate presuppongono una distribuzione normale e sono fondate sulla media e sui momenti della distribuzione. Esistono programmi che utilizzano la mediana come misura della tendenza centrale e ricorrono ai quantili per descrivere la dispersione e la simmetria, come nel caso dei boxplot riportati in figure precedenti. I programmi informatici forniscono una serie di valori, che descrivono compiutamente i dati campionari, come la tabella seguente (tra parentesi è riportato il termine inglese):
Per valutare in modo più dettagliato e completo le caratteristiche delle 36 misure di sodio e cloruri presenti nei laghi campionati, è utile anche la loro rappresentazione in istogrammi. Quasi sempre sono forniti dai medesimi programmi informatici che calcolano anche gli indici già presentati. Nei due istogrammi, i valori riportati sull’asse delle ascisse individuano la media della classe di riferimento. Nel primo grafico, sono riportati in modo alternato per evitare una eccessiva densità di numeri che renderebbe poco agevole la lettura. Sull’asse delle ordinate sono riportate le frequenze assolute. Notare come i rapporti tra l’altezza e la lunghezza dell’istogramma rispondano ai criteri di eleganza grafica, già presentati.
Figura 36 Istogramma delle concentrazioni del Sodio Istogramma delle concentrazioni dei Cloruri
Le due serie di valori hanno una distribuzione normale molto vicino alla normale, con curtosi negativa ed una leggerissima asimmetria, negativa per il sodio e positiva per i cloruri. Per analisi e confronti, possono essere applicati i test parametrici.
ESEMPIO 2. In 4 laghi degli Appennini settentrionali, sono state stimate le densità dei principali taxa fitoplanctonici riportati in tabella:
Rappresentare i dati nelle forme grafiche di uso più comune.
Risposta. Sono distribuzioni di caratteri qualitativi. Le rappresentazioni grafiche adeguate sono i rettangoli distanziati e i diagramma a torta: può essere scelta una delle varie versioni, secondo la caratteristica da evidenziare.
La figura 30 riporta le 5 specie presenti nei 4 laghi con le due differenti versioni di rettangoli distanziati; potrebbero essere utilmente applicati anche gli ortogrammi in una delle due forme equivalenti.
Figura 37. Istogrammi
Lago 1 Lago 2
Figura 38. Diagrammi a torta delle specie presenti nei laghi 1 e 2
I diagrammi a torta dimostrano di essere di più difficile lettura. Senza le percentuali, diventa difficile un confronto tra il numero di individui delle diverse specie presenti (ad esempio nel lago 1 è impossibile distinguere se è più alta la frequenza della specie 4 o della specie 1).\
Lago 3 Lago 4
Figura 39. Diagrammi a torta delle specie presenti nei laghi 3 e 4.
Il confronto visivo tra i 4 diagrammi a torta mostra quanto sia difficile cogliere le differenze tra le 4 distribuzioni, meglio evidenziate dai grafici precedenti, riportati nella figura 37.
ESEMPIO 3. Date due serie di dati relative ai campioni A e B
A: 5 7 2 4 3 B: 15 11 9 8 10 12
calcolare per ognuna di esse - le misure della tendenza centrale, - le misure della dispersione, - gli indici di forma.
Sono stati proposti 2 esercizi con pochi dati, per evitare che i calcoli manuali richiedano troppo tempo. Si chiede di - calcolare la devianza secondo la formula euristica e quella abbreviata, - calcolare la varianza sia con la formula euristica che con quella che considera tutti i possibili scarti tra coppie di dati.
Risposta. Sono riportati i risultati di un programma informatico:
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |