VERIFICA DELLE IPOTESITEST PER UN CAMPIONE SULLA TENDENZA CENTRALE CON VARIANZA NOTAE TEST SULLA VARIANZA CON INTERVALLI DI CONFIDENZA
4.15. intervallo di confidenza o di fiducia di una varianza, con equal tail method E shortest unbiased confidence intervals
Il calcolo dell’intervallo di confidenza di una varianza richiede una procedura più complessa di quella illustrata per l’intervallo di confidenza della media. A differenza della distribuzione Z (utilizzata nei paragrafi precedenti) e della distribuzione t di Student (il cui impiego sarà illustrato nel capitolo relativo) che servono per test sulla media e hanno forma simmetrica, la distribuzione c2, alla quale si ricorre per test sulla varianza, non è simmetrica, quando i campioni non sono grandi. Approssimativamente, poiché varia in funzione dei gradi di libertà e quindi delle dimensioni del campione, ha la forma illustrata nella figura successiva. E’ ovvio che le probabilità collocate ai due estremi dovranno essere stimate separatamente.
DISTRIBUZIONE DEI
VALORI DEL CON UN NUMERO MEDIO DI GRADI DI LIBERTA’
I concetti illustrati nel paragrafo sul confronto tra una varianza campionaria e una attesa hanno dimostrato che - il rapporto tra
le devianza del campione - segue la distribuzione
Da questa legge di distribuzione, si può dedurre che con probabilità tra i due valori estremi
che rappresentano rispettivamente quello inferiore (a sinistra) e quello superiore (a destra). Tale equazione può essere scritta come da cui si ricava che l'intervallo di
confidenza della varianza (s2) della popolazione, stimata a
partire da una varianza campionaria ( è compreso entro i valori oppure, ancor meglio per i calcoli,
Di conseguenza, per
la relazione esistente tra devianza e deviazione standard, è possibile anche
scrivere che l'intervallo di confidenza della deviazione standard (
ESEMPIO 1. Si vuole conoscere l'intervallo di confidenza al 99% della varianza relativa alla presenza di solventi clorurati totali nell'atmosfera di una città. Da un campione di 16
osservazioni, è stata misurata la quantità media d’inquinamento (in mg/m3 a
0° C e a 1013 mbar) e si è calcolata la varianza campionaria Entro quali valori può trovarsi la varianza reale s2 con probabilità del 99% di affermare il vero?
Risposta. Dalla tabella del c2, si devono
rilevare i valori critici con gradi di libertà - per a = 0.995 (1 -
0.005) il valore è - per a = 0.005. il valore
è L’intervallo di confidenza della varianza reale s2
37,44 < s2 < 267,10 In altri termini, con probabilità P = 0,99 è compreso tra - il limite inferiore L1 = 37,44 - il limite superiore L2 = 267,10. E' da mettere in
evidenza come, rispetto al valore centrale (
ESEMPIO 2. Calcolare l'intervallo di confidenza al 95% della varianza reale s2 del carapace della specie Heterocypris incongruens. La varianza di un campione di 41 individui, (misurati in mm), è risultata uguale a 0,0412.
Risposta.
Dapprima si devono individuare i valori critici del c2 con gradi di
libertà - per a = 0.975 il valore
è - per a = 0.025. il valore è
Successivamente si calcola l’intervallo
0,0278 < s2 < 0,0674 ricavando che come valori estremi esso ha - L1 = 0,0278 - L2 = 0,0674.
Per ottenere una stima corretta della varianza e del suo intervallo di confidenza, è sempre importante ricordare che - è condizione essenziale di validità che i dati siano distribuiti in modo normale. La presenza di un
solo valore anomalo è sufficiente per determinare una varianza campionaria
molto maggiore di quella reale. Ma la normalità di una distribuzione
campionaria è difficile da dimostrare, in particolare quando Come già per la media, anche nel caso della varianza l’intervallo fiduciale può essere utilizzato per - valutare se un’altra stima campionaria s2 si differenzia in modo significativo dal valore utilizzato per costruire l’intervallo di confidenza.
Il test con ipotesi nulla H0: alla probabilità a - risulterà non significativo quando la varianza del secondo campione è compresa - mentre risulterà non significativo quando la varianza del secondo campione non è compresa, nell’intervallo
costruito intorno alla prima La proprietà è simmetrica e le due varianze possono esser scambiate: è possibile fondare l'analisi calcolando l’intervallo di confidenza dell’una oppure dell’altra (non di entrambe e vedere se hanno una zona di sovrapposizione).
Oltre - all’equal
tails method qui illustrato, che rappresenta la procedura classica
per calcolare l’intervallo di confidenza della varianza vera - shortest unbiased confidence intervals e è stato proposto da R. F. Tate e G. W. Klett nel 1959 con l’articolo Optimal confidence intervals for the variance of a normal distribution (pubblicato su Journal of the American Statistical Association Vol. 54, pp. 674 - 682). Con questo metodo, si ottiene - l’intervallo di confidenza più breve (shortest), nel senso che il rapporto tra i due valori estremi è il minore possibile. Per questo calcolo, si utilizzano i valori riportati nella tabella successiva. Essi sono costruiti in modo tale che - nel rapporto - la quantità - che permette di
ricavare l’intervallo di confidenza di
I valori della
tabella sono stati pubblicati da D. V. Lindley, D. A. East e P.
A. Hamilton nel 1960 sulla rivista Biometrika (Vol. 47 pp.
433-437). Per un uso ancora più semplice e immediato, sono stati rielaborati
(divisi per i gradi di libertà Nella tabella successiva, dopo aver scelto - la riga - e la colonna corrispondente alla probabilità P (nella tabella sono riportate solo 95% e 99%) si identificano i
due valori I limiti dell’intervallo di confidenza sono: - il limite
inferiore (lower limit) - il limite
superiore (upper limit)
COEFFICIENTI PER DETERMINARE I SHORTEST UNBIASED CONFIDENCE LIMITS FOR THE VARIANCE
ESEMPIO 3. (STESSI DATI DELL’ESEMPIO 1, PER UN CONFRONTO DEI RISULTATI). Si vuole conoscere l'intervallo di confidenza al 99% della varianza relativa alla presenza di solventi clorurati totali nell'atmosfera di una città. Da un campione di 16
osservazioni, è stata misurata la quantità media d’inquinamento (in mg/m3 a
0° C e a 1013 mbar) e si è calcolata la varianza campionaria Entro quali valori può trovarsi la varianza reale s2 con probabilità del 99% di affermare il vero?
Risposta. Dalla tabella, per
L’intervallo di confidenza della varianza reale s2 come limiti ha - il limite
inferiore (lower limit) - il limite
superiore (upper limit)
Il rapporto risulta uguale a 7,03 mentre con il metodo classico o equal tails method si erano ottenuti - il limite inferiore L1 = 37,44 - il limite superiore L2 = 267,10. e quindi un rapporto
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |