VERIFICA DELLE IPOTESI

TEST PER UN CAMPIONE SULLA TENDENZA CENTRALE CON VARIANZA NOTA

E TEST SULLA VARIANZA

CON INTERVALLI DI CONFIDENZA

 

 

4.18.   POTENZA A PRIORI E A POSTERIORI DEL TEST F PER L’UGUAGLIANZA DI DUE VARIANZE

 

 

 

Il test F

- con gdl = 8 al numeratore e gdl = 5 al denominatore

 non permette di dimostrare che la varianza al numeratore (20,55) è statisticamente maggiore di quella al denominatore (8,66). Il test non è significativo, poiché il valore critico per a = 0.05 è F = 4,82.

Spesso è importante sapere quanti dati () sono necessari in ogni gruppo, affinché

-  il test risulti significativo alla probabilità a prefissata,

- e con il rischio b prestabilito.

Per rispondere a questa domanda sono possibili due metodologie:

a) metodi grafici,

b) calcoli fondati su distribuzioni teoriche.

Sono presentati esempi di entrambe le metodologie, benché un loro uso sicuro richieda una trattazione ancor più approfondita e una dotazione più ricca di tabelle e grafici, che possono essere fornite solamente da testi specifici.

 

A)  Il grafico riportato nella pagina successiva è stato proposto nel 1946 da C. D. Ferris, F. E. Grubbs e L. C. Weaver con l’articolo Operating Characteristics for the Common Statistical Tests of Significance (pubblicato su  Annals of Mathematical Statistics Vol. 17, p. 181). Nelle applicazioni industriali della statistica è stato divulgato in particolare dal manuale del Dipartimento di Ricerca della Marina Militare Americana, pubblicato nel 1960, Statistical Manual (con autori Edwin L. Crow, Frances A. Davis, Margaret W. Maxfield, edito da Research Department U. S: Naval Ordnance Test Station, Dover Publications, Inc., New York, XVII + 288 p.).

 

L'uso del grafico è semplice.  Benché l’ipotesi possa essere fatta sulle varianze, è necessario partire dal calcolo del rapporto tra le due deviazioni standard. Utilizzando quelle dell’ultimo esempio,

dove

in cui ora la simbologia

- per il numeratore è  e per il denominatore è

 si ricava

  il rapporto l = 1,54 (deve sempre essere maggiore di 1, come ovvio per il tipo di test).


 

Solamente per la probabilità a = 0.05

-  dopo aver prefissato il rischio b che, ad esempio, potrebbe essere b = 0.2 letto sulle ordinate,

-  sull’asse delle ascisse si cerca il punto corrispondente a  l = 1,54.

-  Il loro punto di incontro approssimativamente cade tra la curva di  = 30 e quella di  = 40.

Si può concludere che servono due campioni, formato ognuno da circa 35 osservazioni.

 

Se,

- mantenendo costanti la probabilità a = 0.05   e   l = 1,54

-  il rischio scelto fosse stato  b = 0.1,

- si sarebbe giunti alla conclusione che approssimativamente servono  = 50 osservazioni per gruppo.

 

Sempre con l’uso del grafico è possibile stimare il rischio b o la potenza  di un test

- conoscendo a e l

- e dopo aver scelto

Ad esempio, sempre a = 0.05 e l = 1,54

- supponendo che le due deviazioni standard siano state calcolate da due campioni bilanciati, formati ognuno da  = 7 dati,

- nel grafico si può osservare che la perpendicolare di l = 1,54 incontra la curva   = 7

- in un punto che sull’asse delle ordinate corrisponde a b = 0.73.

In questo test, il rischio che il rapporto non risultasse significativo era appunto del 73%.

La potenza del test () poteva essere stimata in 0,27 oppure 27% se espressa in percentuale.

 

B) I metodi fondati su distribuzioni teoriche sono numerosi, tutti relativamente complessi in funzione del livello di approssimazione accettato e della forma delle distribuzioni di probabilità assunte come modello dio riferimento.

Anche quando si ricorre all’uso del test F cioè al rapporto tra

- la varianza maggiore () e la varianza minore ()

F =

 per verificare l’ipotesi di omoschedasticità tra due gruppi (A e B),

 quindi per testare l’ipotesi nulla

H0:

 contro l’ipotesi alternativa bilaterale

H1:

 è possibile chiedersi:

“Quanti dati servono affinché l’ipotesi nulla possa essere respinta alla probabilità a, con una probabilità b di commettere un errore di II Tipo?”

E’ la stima della potenza , detta anche potenza a priori.

 

Secondo quanto riportato nel testo di M. M. Desu e D. Raghavarao del 1990 (Sample Size Methodology, Academic Press, Boston, Massachussetts, 135 pp.) e ripreso da Jerrold H. Zar nel testo del 1999 Biostatistical Analysis (fourth edition, Prentice Hall, Upper Saddle River, New Jersey), è possibile utilizzare l’approssimazione alla distribuzione normale, valida per grandi campioni.

In ognuno dei due campioni il numero minimo  di dati è

 

 

dove

 =  valore di Z alla probabilità a in una distribuzione bilaterale,

-   =  valore di Z alla probabilità b in una distribuzione unilaterale,

-     =  logaritmo naturale o neperiano,

 =  valore della varianza maggiore stimata in uno studio pilota,

 = valore della varianza minore stimata nello stesso studio pilota.

 

Volendo utilizzare il logaritmo a base 10 (log), al posto del precedente logaritmo naturale (ln),

l’equazione diventa

 

Nel caso (più raro nella ricerca ambientale e biologica) in cui si voglia, con un test unilaterale, dimostrare che la varianza di un gruppo di osservazioni è maggiore di quella dell’altro gruppo,

per cui l’ipotesi alternativa H1 è

  >      oppure      <

nelle formule precedenti

-  la varianza ipotizzata come maggiore, che deve risultare effettivamente tale, va posta al numeratore,

 =  valore di Z alla probabilità a in una distribuzione unilaterale.

Come già rilevato in precedenza nell’analisi della omoschedasticità con un test unilaterale, questo test ha significato solo se il rapporto tra le due varianze a confronto risulta maggiore di 1.

 

Il valore  stimato rappresenta il numero di osservazioni necessario in ognuno dei due campioni, assunti come uguali.

In alcune condizioni, per il diverso costo delle osservazioni nei due gruppi, si può pensare che i gdl di un gruppo (nA) siano m volte maggiori dei gdl dell’altro gruppo (nB).

Secondo i due testi citati in precedenza,

 =

 

Avendo ricavato  dalle formule precedenti e prefissato  sulla base dei costi,

si ricava prima

 =

e da esso

 =

 

La stima di , cioè il numero di dati necessari a rendere significativo il test, è chiamata potenza a priori.

Spesso, soprattutto quando un test non risulta significativo, è utile chiedersi quale era la probabilità che esso potesse risultarlo: è la potenza a posteriori o, più semplicemente, la potenza del test ().

 

Se due campioni hanno lo stesso numero di dati (), il valore di Zb  (sempre in una distribuzione unilaterale, per stimare la potenza sia a priori che a posteriori)

- usando il logaritmo naturale () è

Zb =  - Za

- usando il logaritmo a base 10 () è

Zb =  - Za

dove

-  Za deve essere preso in una distribuzione bilaterale oppure unilaterale, in rapporto a quanto esplicitato nell’ipotesi H1 (se un test a due code o a una coda).

 

Se due campioni hanno un numero differente di dati (), si deve introdurre un termine di correzione alla dimensione : il nuovo valore risulterà inferiore alla medie aritmetica tra e

Dopo aver stimato  con

 = 

dove

 =  numero di dati del gruppo con varianza (s2) maggiore (non del gruppo con più dati)

 =  numero di dati del gruppo con varianza (s2) minore (non del gruppo più piccolo)

 nelle formule precedenti al posto di

 si introduce

  

dove

 = numero di dati della varianza al denominatore.

Di conseguenza, il valore di Zb  (sempre in una distribuzione unilaterale)

-  usando il logaritmo naturale () è

 

Zb =  - Za


 

- usando il logaritmo a base 10 () è

Zb =  - Za

dove

-  Za deve essere preso in una distribuzione bilaterale oppure unilaterale, in rapporto a quanto esplicitato nell’ipotesi H1

 

ESEMPIO 1.  Per applicare un test parametrico sul confronto tra due medie per due campioni indipendenti, si richiede l’omoschedasticità della varianza.

In uno studio preliminare, sui campione A e B si sono ottenuti i seguenti risultati

 

Campioni

A

B

12

13

Varianza  (s2)

0,015

0,0314

 

 con i quali

F (12,11) =

 

 non era stata rifiutata l’ipotesi nulla

H0:

- poiché il loro rapporto F è uguale a 2,093

- mentre il valore critico di F(12,11) per il livello di probabilità a = 0.05 è 2,79.

 

Calcolare

a) Quanti dati () per ogni gruppo sarebbero stati necessari, per dimostrare che le due varianze sono significativamente differenti

-  alla probabilità a = 0.05

-  con un rischio d’errore di II tipo (b) = 0.10 (o una potenza 1-b = 0.90)?

 

b) Quale è la potenza () del test eseguito?


 

Risposte

A) E’ un test bilaterale, in cui

-  per a = 0.05 in una distribuzione bilaterale il valore di Z è 1,96

-  per b = 0.10 in una distribuzione unilaterale il valore di Z è 1,28

 con

 si ottiene

 = 21,24

 

 un numero minimo  = 22 osservazioni, per ognuno dei due gruppi.

Anche con questa dimostrazione si mostra quanto fosse errato, in un esempio precedente con un campione piccolo, arrivare alla conclusione che le due varianze erano simili, semplicemente perché non era stata rifiutata l’ipotesi nulla alla probabilità del 5%. Sarebbe stato sufficiente raddoppiare il numero di osservazioni (passare rispettivamente da 12 e 13 dati nei due gruppi a 22 per ognuno) per giungere alla conclusione che le due varianze sono significativamente differenti, con una probabilità del 90 per cento.

 

B) Con due campioni sbilanciati, in cui i dati della varianza al numeratore sono 13 e quelli della varianza al denominatore sono 12,

 =  1,091

 si ricava  = 1,091

  e che il valore di Zb

Zb=  - Za

con   

-  il valore di Za, alla probabilità a = 0.05 in una distribuzione bilaterale, uguale a 1,96

 = 12

 risulta

Zb =  - 1,96

 

Zb =  = 0,425

uguale a 0,425.

In una distribuzione unilaterale, ad esso corrisponde un valore di probabilità  collocato tra 0,337 e 0,334. In conclusione,

-  la probabilità che il test non risultasse significativo era 0,335 o, espressa in percentuale, del 33,5%

- e quindi la potenza del test  era pari a 0,665 o, quando espressa in percentuale, del 66,5%

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007