VERIFICA DELLE IPOTESI

TEST PER UN CAMPIONE SULLA TENDENZA CENTRALE CON VARIANZA NOTA

E TEST SULLA VARIANZA

CON INTERVALLI DI CONFIDENZA

4.19. INTERVALLO DI CONFIDENZA DEL RAPPORTO F TRA DUE VARIANZE; STIMA DI F CON UN ERRORE O UN INTERVALLO DI CONFIDENZA PREFISSATI.

Il valore di F determinato dal rapporto tra due varianze campionarie e

è solamente una stima del rapporto tra le due varianze vere e

Di conseguenza, è utile la determinazione corretta dell’intervallo di confidenza, che può essere calcolato per qualsiasi probabilità P = prefissata. La metodologia è resa relativamente complessa dalla asimmetria della distribuzione dei valori .

Utilizzando i valori critici di F nella parte destra della distribuzione, che sono quelli per a > 0.5 discussi nel paragrafo precedente, si ottengono

- il limite inferiore (lower limit) con

- il limite superiore (upper limit) con

dove

- a/2 è la probabilità nella coda destra, considerando che la distribuzione deve essere bilaterale,

- n₁ e n₂ sono i gradi di libertà del numeratore e del denominatore, che devono essere scambiati.

(I simboli riportati tra parentesi dopo F non sono ridotti per favorire una loro lettura corretta)

A motivo delle relazioni illustrate nel paragrafo precedente, è possibile stimare il limite superiore (upper limit) anche con una formula

(ponendo attenzione all’indice ,

cioè al fatto che deve essere calcolato nella coda sinistra della distribuzione, ma utilizzando tabelle che riportano solo valori di F > 1).

Le relazioni valide per l’intervallo di confidenza del rapporto tra le due varianze sono facilmente estese alla stima dell’intervallo di confidenza del rapporto tra le loro deviazioni standard ():

- il limite inferiore (lower limit) è

- il limite superiore (upper limit) è

dove

- a/2, n₁ e n₂.sono uguali a quelli definiti per il rapporto tra due varianze

Il passaggio dal rapporto tra due varianze () a quello delle loro deviazioni standard () a volte è richiesto dall’uso di grafici e tabelle, come già visto per la potenza di una deviazione standard e come è spiegato nella seconda parte di questo paragrafo. Il valore F diventa lineare e quindi può essere elaborato e rappresentato graficamente con maggiore semplicità e letto più facilmente.

La metodologia illustrata è valida per qualsiasi rapporto tra due varianze; ma abitualmente è applicata per il test F di omoschedasticità, vale a dire per il rapporto tra la varianza maggiore e quella minore.

ESEMPIO 1. (INTERVALLO DI CONFIDENZA DEL RAPPORTO F TRA DUE VARIANZE E TRA DUE DEVIAZIONI STANDARD). Lo studio della variabilità di due prodotti ha permesso di ricavare

- per il primo = 8,64 con 6 misure campionarie.

- per il secondo = 20,55 con 9 misure campionarie.

Determinare:

a) l’intervallo di confidenza del rapporto alla probabilità alla probabilità P = 0.95

b) l’intervallo di confidenza del rapporto alla probabilità alla probabilità P = 0.95

Risposte. Dapprima occorre individuare il rapporto F corretto. La varianza maggiore è quella del secondo campione e quindi

il test F per l'omoschedasticità è

- con gdl = 8 al numeratore e gdl = 5 al denominatore.

A) Per ottenere l’intervallo di confidenza alla probabilità P = 0.95 del

rapporto tra le due varianze

dapprima dalla tabella dei valori critici di F si rilevano

- per a = 0.025 con gdl = 8 al numeratore e gdl = 5 al denominatore il valore F = 6,76

- per a = 0.025 con gdl = 5 al numeratore e gdl = 8 al denominatore il valore F = 4,82

(poiché esse riportano solo le probabilità a minori, quelle nella coda destra della distribuzione).

Successivamente si calcolano:

- il limite inferiore (lower limit)

- il limite superiore (upper limit)

B) Per le due deviazioni standard, dopo averle ricavate dalle varianze

per ottenere l’intervallo di confidenza alla probabilità P = 0.95 loro

rapporto

dapprima dalla tabella dei valori critici di F, che riportano solo le probabilità a minori, si rilevano

- per a = 0.025 con gdl = 8 al numeratore e gdl = 5 al denominatore il valore F = 6,76

- per a = 0.025 con gdl = 5 al numeratore e gdl = 8 al denominatore il valore F = 4,82

Infine si ottengono:

- il limite inferiore (lower limit)

- il limite superiore (upper limit)

E’ semplice osservare che tra le due coppie di limiti si mantengono le stesse relazioni quadratiche che esistono tra devianze e deviazioni standard:

- il limite inferiore (lower limit) è 0,593² = 0,351

- il limite superiore (upper limit) è 3,38² = 11,42

(a meno delle approssimazioni nei calcoli, effettuate alla terza cifra decimale).

E’ quindi facile passare dal rapporto tra due varianze al rapporto tra due deviazioni standard.

In varie condizioni sperimentali, al ricercatore è richiesto non di effettuare un test di confronto sulla significatività del rapporto tra due varianze come nei paragrafi precedenti, ma solamente

- di calcolare il rapporto reale tra le due varianze vere ,

- con la precisione minima desiderata o l’errore massimo prestabilito.

Sebbene apparentemente simili ai test precedenti sulla significatività del rapporto tra due varianze, queste stime sulla precisione del rapporto sono in realtà nettamente differenti, poiché in questo caso

- nella stima di , le dimensioni minime dei due campioni,

- non è implicato il rischio , ma solamente quello , in quanto non si tratta di un confronto.

I metodi di calcolo sono complessi e sono riportati su pochi testi. E’ molto più rapido e semplice utilizzare i metodi grafic. In questo caso, come già illustrato per un solo campione, essi utilizzano non la varianza ma la deviazione standard. Sempre come il grafico precedente per un campione, anche quello successivo è tratto dal manuale del Dipartimento di Ricerca della Marina militare Americana, pubblicato nel 1960, Statistical Manual (con autori Edwin L. Crow, Frances A. Davis, Margaret W. Maxfield, edito da Research Department U. S: Naval Ordnance Test Station, Dover Publications, Inc., New York, XVII + 288 p.).

Benché l’ipotesi possa essere fatta sulle varianze, nei calcoli è necessario utilizzare il rapporto tra le due deviazioni standard.

L'uso del grafico è semplice:

1 – per stimare il rapporto reale con la percentuale di errore o scarto massimo accettato (P%), che ovviamente può essere in entrambe le direzioni,

2 – si sceglie l'indice P% riportato sull’asse delle ascisse e si sale verticalmente,

3 – fino a incontrare in un punto la retta del coefficiente di confidenza, che in questo caso è limitata alle tre probabilità di uso più frequente (P = 0:9 P = 0.95 P = 0.99 e che indicano la probabilità prescelta di commettere un errore a nell'affermare che il valore reale è collocato entro l'intervallo indicato);

4 – spostandosi lateralmente da questo punto verso l’asse delle ordinate, si ottiene il numero di gradi di libertà che deve avere ogni campione del rapporto sperimentale ricavato.

ESEMPIO 2 (USO DEL GRAFICO PER STIMARE ). Quanto grandi devono essere due campioni affinché il rapporto tra le loro deviazioni standard

- abbia uno scarto massimo del 30 % rispetto al rapporto vero o reale

- con un coefficiente di confidenza del 95%?

Risposta. Sull’asse delle ascisse,

- si individua il valore = 30 e si sale verticalmente,

- fino a incontrare la retta del coefficiente di confidenza 0,95 in un punto che,

- trasferito orizzontalmente sull’asse delle ordinate, corrisponde a 45 gradi di libertà.

Servono almeno 46 misure per ognuno dei due campioni. Con esse sarà possibile calcolare un rapporto tra le due deviazioni standard che, con una probabilità di errare minore del 5%, nell’intervallo ± il 30% sarà compreso il rapporto vero

Il numero calcolato per il rapporto tra le due deviazioni standard può essere esteso al rapporto tra le due varianze.

Nella lettura del numero di gradi di libertà sull’asse delle ordinate, occorre porre attenzione al fatto che la scala è di tipo logaritmico e quindi l’errore nella lettura di diventa molto più grande, in frequenze assolute, per valori maggiori.

Il numero di dati necessari aumenta notevolmente, quando si sceglie di commettere un errore minore. Questo errore può essere quantificato definendo l’ampiezza dell’intervallo di confidenza della deviazione standard, in percentuale rispetto al valore della deviazione standard.

La lettura del grafico può essere fatta anche nell'altra direzione:

- partendo (sull'asse delle ordinate) dal numero di dati disponibili per ognuno dei due campioni bilanciati,

- dopo aver incontrato il coefficiente di confidenza prescelto,

- ricavare la dimensione dell'intervallo (sull'asse delle ascisse) entro il quale si troverà il valore reale del rapporto F.