VERIFICA DELLE IPOTESITEST PER UN CAMPIONE SULLA TENDENZA CENTRALE CON VARIANZA NOTAE TEST SULLA VARIANZA CON INTERVALLI DI CONFIDENZA
4.16. INTERVALLO DI CONFIDENZA DELLA DEVIAZIONE STANDARD E STIMA DELLA DIMENSIONE DEL CAMPIONE
Nel paragrafo precedente, è stata presentata la serie di passaggi logici che dimostrano come i valori estremi dell'intervallo di confidenza della deviazione standard () della popolazione possano essere calcolati anche mediante
in modo del tutto analogo al metodo presentato per la varianza
ESEMPIO 1. Su 20 campioni di un farmaco, è stata misurata la quantità di principio attivo: la deviazione standard è risultata = 10,7. Quale è il limite di confidenza della deviazione standard vera per la quantità di principio attivo presente nel farmaco, alla probabilità del 95%?
Risposta. Per utilizzare la formula appena riportata, con = 10,7 e = 19 servono anche i valori critici del per = 0,05 in totale, considerando le due code della distribuzione: - per a = 0.975 il valore è = 8,907 - per a = 0.025 il valore è = 32,852. Con essi, - il limite inferiore (lower limit)
risulta L1 = 8,13 - il limite superiore (upper limit)
risulta L2 = 15,63.
In molte aziende, queste misure dell’intervallo di confidenza della deviazione standard rientrano nella routine, per il controllo di qualità della produzione. Di conseguenza, il calcolo è stato semplificato con l’uso di tabelle, come la successiva. Soprattutto nel passato, quando i calcoli erano svolti manualmente e quindi richiedevano tempo, la preferenza era data a questi metodi grafici. Nel manuale della Marina Americana già citato, rispetto ai calcoli illustrati nel paragrafo precedente, per evitare inutili complicazioni era raccomandato: The following method is preferable in practice.
COEFFICIENTI PER DETERMINARE I LIMITI DELL’INTERVALLO DI CONFIDENZA DELLA DEVIAZIONE STANDARD s
Per la probabilità a prestabilita e per i gradi di libertà (DF) del campione, - il limite inferiore è L1 = - il limite superiore è L2 = dove e sono tratti dalla tabella precedente. Essi possono essere ricavati facilmente da e
Ad esempio, con gradi di libertà (DF) = = 19, i valori critici del per = 0,05 in totale, considerando le due code della distribuzione, sono - per a = 0.975 il valore = 8,907 - per a = 0.025 il valore = 32,852 Nella tabella sono riportati i coefficienti = 0,760 e = 1,461. E’ semplice osservare che possono essere ottenuti da e con arrotondamento.
Per campioni grandi (DF >100), sempre secondo quanto riportato nello stesso manuale, i valori e sono ricavati dalle formule seguenti: - per da
- per da
- per da
ESEMPIO 2 (CON GLI STESSI DATI DELL’ESEMPIO 1). Su 20 campioni di un farmaco, è stata misurata la quantità di principio attivo: la deviazione standard è risultata = 10,7. Quale è il limite di confidenza della deviazione standard vera per la quantità di principio attivo presente nel farmaco, alla probabilità del 95%?
Risposta. Per = 19 e = 0,05 nella tabella sono riportati i coefficienti = 0,760 e = 1,461. Di conseguenza, con = 10,7 - il limite inferiore è L1 = = = 8,13 - il limite superiore è L2 = = = 15,63
Il calcolo dell’intervallo di confidenza della deviazione standard non comporta alcun vantaggio, né teorico né pratico, rispetto al calcolo equivalente effettuato con la varianza. L’uso della deviazione standard diventa utile, - quando attraverso i metodi grafici si voglia determinare la dimensione del campione necessario, - per stimare con un scarto massimo determinato in percentuale () e un livello di confidenza .
ESEMPIO 3 (USO DEL GRAFICO PER STIMARE ). Per stimare la variabilità di un prodotto industriale, quante misure campionarie occorre raccogliere se - si vuole ottenere una deviazione standard che nell’intervallo con più o meno il 30% - abbia una probabilità P del 95% di contenere il valore vero ?
Risposta. Sull’asse delle ascisse, - si individua il valore = 30 e si sale verticalmente, - fino a incontrare la retta del coefficiente di confidenza 0,95 in un punto - che trasferito orizzontalmente sull’asse delle ordinate corrisponde ai gradi di libertà 20-21. Servono almeno 21-22 misure, per calcolare un valore in modo che, con una probabilità di errare minore del 5%, il valore vero sia compreso nell’intervallo ± il 30%.
Il grafico precedente è una modifica, fatta dagli autori del testo della marina militare americana, del metodo proposto da Greenwood J. A. e M. M. Sandmire nel 1950 nell’articolo Sample Size Required for Estimating tre Standard Deviation as a Percent of Its True Value (su Journal of the American Statistical Association Vol. 45, p. 258), allo scopo di renderne l’uso ancora più semplice e rapido.
ESEMPIO 4 (USO DEL GRAFICO PER STIMARE E CONFRONTO DEL RISULTATO CON L'ESEMPIO 3). Per stimare la variabilità di un prodotto industriale, quante misure campionarie occorre raccogliere se - si vuole ottenere una deviazione standard che nell’intervallo con più o meno il 10% - abbia una probabilità P del 95% di contenere il valore vero ?
Risposta. Sull’asse delle ascisse, - si individua il valore = 10 e si sale verticalmente, - fino a incontrare la retta del coefficiente di confidenza 0,95 in un punto - che, trasferito orizzontalmente sull’asse delle ordinate, corrisponde a gradi di libertà 190. Servono almeno 190 misure Nella lettura del numero di gradi di libertà sull’asse delle ordinate, occorre porre attenzione al fatto che la scala è di tipo logaritmico e quindi per valori maggiori dei gradi di libertà l’errore nell’approssimazione diventa molto più grande, in frequenze assolute
Il numero di dati necessari aumenta notevolmente, quando si sceglie di commettere un errore minore. Questo errore può essere quantificato definendo l’ampiezza dell’intervallo di confidenza della deviazione standard, in percentuale rispetto al valore della deviazione standard. Più esattamente, - tra il valore e il numero dei DF - si mantengono le relazioni quadratiche, già illustrate per la differenza e nel calcolo di una media con la precisione richiesta. A dimostrazione di questa relazione, nel confronto tra i risultati degli ultimi due esempi (3 e 4) è semplice osservare che - nell’esempio 4 l’errore massimo che si vuole commettere = 10 corrisponde a 1/3 di quello accettato nell’esempio 3 - e che il numero minimo di dati richiesto è moltiplicato per 9 (da 21-22 a circa 190).
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |