VERIFICA DELLE IPOTESITEST PER UN CAMPIONE SULLA TENDENZA CENTRALE CON VARIANZA NOTAE TEST SULLA VARIANZA CON INTERVALLI DI CONFIDENZA
4.19. INTERVALLO DI CONFIDENZA DEL RAPPORTO F TRA DUE VARIANZE; STIMA DI F CON UN ERRORE O UN INTERVALLO DI CONFIDENZA PREFISSATI.
Il valore di F
determinato dal rapporto tra due varianze campionarie
è solamente una
stima del rapporto tra le due varianze vere
Di conseguenza, è
utile la determinazione corretta dell’intervallo di confidenza, che può
essere calcolato per qualsiasi probabilità P = dove - a/2 è la probabilità nella coda destra, considerando che la distribuzione deve essere bilaterale, - n1 e n2 sono i gradi di libertà del numeratore e del denominatore, che devono essere scambiati.
Le relazioni valide
per l’intervallo di confidenza del rapporto tra le due varianze sono facilmente
estese alla stima dell’intervallo di confidenza del rapporto tra le loro
deviazioni standard ( dove - a/2, n1 e n2.sono uguali a quelli definiti per il rapporto tra due varianze
Il passaggio dal
rapporto tra due varianze (
La metodologia illustrata è valida per qualsiasi rapporto tra due varianze; ma abitualmente è applicata per il test F di omoschedasticità, vale a dire per il rapporto tra la varianza maggiore e quella minore.
ESEMPIO 1. (INTERVALLO DI CONFIDENZA DEL RAPPORTO F TRA DUE VARIANZE E TRA DUE DEVIAZIONI STANDARD). Lo studio della variabilità di due prodotti ha permesso di ricavare - per il primo - per il secondo Determinare: a) l’intervallo di confidenza del
rapporto b) l’intervallo di confidenza del rapporto
Risposte. Dapprima occorre individuare il rapporto F corretto. La varianza maggiore è quella del secondo campione e quindi il test F per l'omoschedasticità è - con gdl = 8 al numeratore e gdl = 5 al denominatore.
A) Per ottenere l’intervallo di confidenza alla probabilità P = 0.95 del rapporto tra le due varianze
dapprima dalla tabella dei valori critici di F si rilevano - per a = 0.025 con gdl = 8 al numeratore e gdl = 5 al denominatore il valore F = 6,76 - per a = 0.025 con gdl = 5 al numeratore e gdl = 8 al denominatore il valore F = 4,82 (poiché esse riportano solo le probabilità a minori, quelle nella coda destra della distribuzione). Successivamente si calcolano:
B) Per le due deviazioni standard, dopo averle ricavate dalle varianze - - per ottenere l’intervallo di confidenza alla probabilità P = 0.95 loro rapporto
dapprima dalla tabella dei valori critici di F, che riportano solo le probabilità a minori, si rilevano - per a = 0.025 con gdl = 8 al numeratore e gdl = 5 al denominatore il valore F = 6,76 - per a = 0.025 con gdl = 5 al numeratore e gdl = 8 al denominatore il valore F = 4,82 Infine si ottengono:
E’ semplice osservare che tra le due coppie di limiti si mantengono le stesse relazioni quadratiche che esistono tra devianze e deviazioni standard: (a meno delle approssimazioni nei calcoli, effettuate alla terza cifra decimale).
E’ quindi facile passare dal rapporto tra due varianze al rapporto tra due deviazioni standard. In varie condizioni sperimentali, al ricercatore è richiesto non di effettuare un test di confronto sulla significatività del rapporto tra due varianze come nei paragrafi precedenti, ma solamente - di calcolare
il rapporto reale - con la precisione minima desiderata o l’errore massimo prestabilito.
Sebbene apparentemente
simili ai test precedenti sulla significatività del rapporto - nella stima
di - non è
implicato il rischio
I metodi di calcolo sono complessi e sono riportati su pochi testi. E’ molto più rapido e semplice utilizzare i metodi grafic. In questo caso, come già illustrato per un solo campione, essi utilizzano non la varianza ma la deviazione standard. Sempre come il grafico precedente per un campione, anche quello successivo è tratto dal manuale del Dipartimento di Ricerca della Marina militare Americana, pubblicato nel 1960, Statistical Manual (con autori Edwin L. Crow, Frances A. Davis, Margaret W. Maxfield, edito da Research Department U. S: Naval Ordnance Test Station, Dover Publications, Inc., New York, XVII + 288 p.).
Benché l’ipotesi possa essere fatta sulle varianze, nei calcoli è necessario utilizzare il rapporto tra le due deviazioni standard.
L'uso del grafico è semplice: 1 – per stimare il rapporto
reale 2 – si sceglie l'indice P% riportato sull’asse delle ascisse e si sale verticalmente, 3 – fino a incontrare in un punto la retta del coefficiente di confidenza, che in questo caso è limitata alle tre probabilità di uso più frequente (P = 0:9 P = 0.95 P = 0.99 e che indicano la probabilità prescelta di commettere un errore a nell'affermare che il valore reale è collocato entro l'intervallo indicato); 4 – spostandosi
lateralmente da questo punto verso l’asse delle ordinate, si ottiene il numero
di gradi di libertà che deve avere ogni campione del rapporto
ESEMPIO 2 (USO DEL
GRAFICO PER STIMARE - abbia uno scarto
massimo del 30 % rispetto al rapporto vero o reale - con un coefficiente di confidenza del 95%?
Risposta. Sull’asse delle ascisse, - si individua il
valore - fino a incontrare la retta del coefficiente di confidenza 0,95 in un punto che, - trasferito orizzontalmente sull’asse delle ordinate, corrisponde a 45 gradi di libertà. Servono almeno 46
misure per ognuno dei due campioni. Con esse sarà possibile calcolare un
rapporto tra le due deviazioni standard
Il numero Nella lettura del numero
di gradi di libertà sull’asse delle ordinate, occorre porre attenzione al
fatto che la scala è di tipo logaritmico e quindi l’errore nella lettura
di Il numero
La lettura del grafico può essere fatta anche nell'altra direzione: - partendo (sull'asse delle ordinate) dal numero di dati disponibili per ognuno dei due campioni bilanciati, - dopo aver incontrato il coefficiente di confidenza prescelto, - ricavare la dimensione dell'intervallo (sull'asse delle ascisse) entro il quale si troverà il valore reale del rapporto F.
| |
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |