VERIFICA DELLE IPOTESI

TEST PER UN CAMPIONE SULLA TENDENZA CENTRALE CON VARIANZA NOTA

E TEST SULLA VARIANZA

CON INTERVALLI DI CONFIDENZA

 

 

4.17. IL TEST F PER IL RAPPORTO TRA DUE VARIANZE; RELAZIONI TRA F E c2; VALORI DI  F  PER  a > 0,5

 

 

Quando si dispone di

-  due campioni indipendenti,

- entrambi distribuiti in modo normale,

 e per ognuno di essi si calcola la varianza   e  , spesso si pone il problema di testare se esse sono uguali o differenti. Si vuole verificare l’ipotesi

H0:           contro          H1:

 A differenza di quanto avviene quando si confrontano due medie,

-  dove i test utilizzano la differenza

 nel confronto tra due varianze i test utilizzano

-  il rapporto tra le due varianze   e 

 chiamato variance ratio test.   

E’ universalmente indicato con la lettera F, in onore di Sir Ronald Aylmer Fisher (1890 –1962).

Se è vera l'ipotesi nulla H0,

-   per due medie la differenza  tende a zero e varia simmetricamente intorno a esso,

-  per due varianze il rapporto tende da 1 e varia da 1 a 0  oppure da 1 a +¥.

Come per la distribuzione normale e la distribuzione c2, per le applicazioni che ne derivano è importante conoscere la forma della distribuzione di tale rapporto .

Nella figura successiva,

-  la curva inferiore (con  e ), fortemente asimmetrica, è un caso con pochi gradi di libertà; in modo più specifico, è la distribuzione di frequenza del rapporto F tra la varianza del campione 1 con  = 11 dati e la varianza del campione 2 con  = 5 dati;

-  la curva superiore (con  e ), molto più simmetrica, è un caso con un numero abbastanza alto di gradi di libertà; è la variazione di F quando la varianza del campione 1 ha = 31 dati e la varianza del campione 2 ha  = 61 dati.

La c2 che ha una distribuzione differente per ogni grado di libertà. La distribuzione  è determinata da una coppia di gradi di libertà, ognuno dei quali può variare da 1 a infinito.


 


 

DISTRIBUZIONE DI FREQUENZA DEL RAPPORTO

 

 

In realtà, per verificare se le due varianze sono uguali, in termini più tecnici per verificare l’ipotesi bilaterale

H0:           contro          H1:

 il rapporto non è prefissato ma si utilizza


 

Valori critici della distribuzione F di Fisher-Snedecor con a  =  0.05

I gradi di libertà del numeratore (o varianza maggiore) sono riportati in orizzontale (prima riga)

I gradi di libertà del denominatore (o varianza minore) sono riportati in verticale (prima colonna)

 

NUMERATORE

DEN.

1

2

3

4

5

6

7

8

12

24

¥

1

161,4

199,5

215,7

224,6

230,2

234,0

236,8

238,9

243,9

249,1

254,3

2

18,51

19,00

19,16

19,25

19,30

19,33

19,35

19,37

19,41

19,45

19,50

3

10,13

9,55

9,28

9,12

9,01

8,94

8,89

8,85

8,74

8,64

8,53

4

7,71

6,94

6,59

6,39

6,26

6,16

6,09

6,04

5,91

5,77

5,63

5

6,61

5,79

5,41

5,19

5,05

4,95

4,88

4,82

4,68

4,53

4,36

6

5,99

5,14

4,76

4,53

4,39

4,28

4,21

4,15

4,00

3,84

3,67

7

5,59

4,74

4,35

4,12

3,97

3,87

3,79

3,73

3,57

3,41

3,23

8

5,32

4,46

4,07

3,84

3,69

3,58

3,50

3,44

3,28

3,12

2,93

9

5,12

4,26

3,86

3,63

3,48

3,37

3,29

3,23

3,07

2,90

2,71

10

4,96

4,10

3,71

3,48

3,33

3,22

3,14

3,07

2,91

2,74

2,54

12

4,75

3,89

3,49

3,26

3,11

3,00

2,91

2,85

2,69

2,51

2,30

14

4,60

3,74

3,34

3,11

2,96

2,85

2,76

2,70

2,53

2,35

2,13

16

4,49

3,63

3,24

3,01

2,85

2,74

2,66

2,59

2,42

2,24

2,01

18

4,41

3,55

3,16

2,93

2,77

2,66

2,58

2,51

2,34

2,15

1,92

20

4,35

3,49

3,10

2,87

2,71

2,60

2,51

2,45

2,28

2,08

1,84

30

4,17

3,32

2,92

2,69

2,53

2,42

2,33

2,27

2,09

1,89

1,62

40

4,08

3,23

2,84

2,61

2,45

2,34

2,25

2,18

2,00

1,79

1,51

60

4,00

3,15

2,76

2,53

2,37

2,25

2,17

2,10

1,92

1,70

1,39

120

3,92

3,07

2,68

2,45

2,29

2,17

2,09

2,02

1,83

1,61

1,25

¥

3,84

3,00

2,60

2,37

2,21

2,10

2,01

1,94

1,75

1,52

1,00


 

Valori critici della distribuzione F di Fisher-Snedecor con a  =  0.025

I gradi di libertà del numeratore (o varianza maggiore) sono riportati in orizzontale (prima riga)

I gradi di libertà del denominatore (o varianza minore) sono riportati in verticale (prima colonna)

 

NUMERATORE

DEN.

1

2

3

4

5

6

7

8

12

24

¥

1

647,8

799,5

864,2

899,6

921,8

937,1

948,2

956,7

976,7

997.2

1018

2

38,51

39,00

39,17

39,25

39,30

39,33

39,36

39,37

39,41

39,46

39,50

3

17,44

16,04

15,44

15,10

14,88

14,73

14,62

14,54

14,34

14,12

13,90

4

12,22

10,65

9,98

9,60

9,36

9,20

9,07

8,98

8,75

8,51

8,26

5

10,01

8,43

7,76

7,39

7,15

6,98

6,85

6,76

6,52

6,28

6,02

6

8,81

7,26

6,60

6,23

5,99

5,82

5,70

5,60

5,37

5,12

4,85

7

8,07

6,54

5,89

5,52

5,29

5,12

4,99

4,90

4,67

4,42

4,14

8

7,57

6,06

5,42

5,05

4,82

4,65

4,53

4,43

4,20

3,95

3,67

9

7,21

5,71

5,08

4,72

4,48

4,32

4,20

4,10

3,87

3,61

3,33

10

6,94

5,46

4,83

4,46

4,24

4,06

3,95

3,85

3,62

3,37

3,08

12

6,55

5,10

4,47

4,12

3,89

3,73

3,61

3,51

3,28

3,02

2,72

14

6,30

4,86

4,24

3,89

3,66

3,50

3,38

3,29

3,05

2,79

2,49

16

6,12

4,69

4,08

3,73

3,50

3,34

3,22

3,12

2,89

2,63

2,32

18

5,98

4,56

3,95

3,61

3,38

3,22

3,10

3,01

2,77

2,50

2,19

20

5,87

4,46

3,86

3,51

3,29

3,13

3,01

2,91

2,68

2,41

2,09

30

5,57

4,18

3,59

3,25

3,03

2,87

2,75

2,65

2,41

2,14

1,79

40

5,42

4,05

3,46

3,13

2,90

2,74

2,62

2,53

2,29

2,01

1,64

60

5,29

3,93

3,34

3.01

2,79

2,63

2,51

2,41

2,17

1,88

1,48

120

5,15

3,80

3,23

2,89

2,67

2,52

2,39

2,30

2,05

1,76

1,31

¥

5,02

3,69

3,12

2,79

2,57

2,41

2,29

2,19

1,94

1,64

1,00


 

Valori critici della distribuzione F di Fisher-Snedecor con a  =  0.01

I gradi di libertà del numeratore (o varianza maggiore) sono riportati in orizzontale (prima riga)

I gradi di libertà del denominatore (o varianza minore) sono riportati in verticale (prima colonna)

 

NUMERATORE

DEN.

1

2

3

4

5

6

7

8

12

24

¥

1

4052

5000

5403

5625

5764

5859

5928

5981

6106

6235

6366

2

98,50

99,00

99,17

99,25

99,30

99,33

99,36

99,37

99,41

99,46

99,50

3

34,12

30,82

29,46

28,71

28,24

27,91

27,67

27,49

27,05

26,60

26,13

4

21,20

18,00

16,69

15,98

15,52

15,21

14,98

14,80

14,37

13,93

13,46

5

16,26

13,27

12,06

11,39

10,97

10,67

10,46

10,29

9,89

9,47

9,02

6

13,75

10,92

9,78

9,15

8,75

8,47

8,26

8,10

7,72

7,31

6,88

7

12,25

9,55

8,45

7,85

7,46

7,19

6,99

6,84

6,47

6,07

5,65

8

11,26

8,65

7,59

7,01

6,63

6,37

6,18

6,03

5,67

5,28

4,86

9

10,56

8,02

6,99

6,42

6,06

5,80

5,61

5,47

5,11

4,73

4,31

10

10,04

7,56

6,55

5,99

5,64

5,39

5,20

5,06

4,71

4,33

3,91

12

9,33

6,93

5,95

5,41

5,06

4,82

4,64

4,50

4,16

3,78

3,36

14

8,86

6,51

5,56

5,04

4,69

4,46

4,28

4,14

3,80

3,43

3,00

16

8,53

6,23

5,29

4,77

4,44

4,20

4,03

3,89

3,55

3,18

2,75

18

8,29

6,01

5,09

4,58

4,25

4,01

3,84

3,71

3,37

3,00

2,57

20

8,10

5,85

4,94

4,43

4,10

3,87

3,70

3,56

3,23

2,86

2,42

30

7,56

5,39

4,51

4,02

3,70

3,47

3,30

3,17

2,84

2,47

2,01

40

7,31

5,18

4,31

3,83

3,51

3,29

3,12

2,99

2,66

2,29

1,80

60

7,08

4,98

4,13

3,65

3,34

3,12

2,95

2,82

2,50

2,12

1,60

120

6,85

4,79

3,95

3,48

3,17

2,96

2,79

2,66

2,34

1,95

1,38

¥

6,63

4,61

3,78

3,32

3,02

2,80

2,64

2,51

2,18

1,79

1,00


 

Valori critici della distribuzione F di Fisher-Snedecor a  =  0.005

I gradi di libertà del numeratore (o varianza maggiore) sono riportati in orizzontale (prima riga)

I gradi di libertà del denominatore (o varianza minore) sono riportati in verticale (prima colonna)

 

NUMERATORE

DEN.

1

2

3

4

5

6

7

8

12

24

¥

1

16211

20000

21615

22500

23056

23437

23715

23925

24426

24940

25465

2

198,5

199,0

199,2

199,2

199,3

199,3

199,4

199,4

199,4

199,5

199,5

3

55,55

49,80

47,47

46,19

45,39

44,84

44,43

44,13

43,39

42,62

41,83

4

31,33

26,28

24,26

23,15

22,46

21,97

21,62

21,35

20,70

20,03

19,32

5

22,78

18,31

16,53

15,56

14,94

14,51

14,20

13,96

13,38

12,78

12,14

6

18,63

14,54

12,92

12,03

11,46

11,07

10,79

10,57

10,03

9,47

8,88

7

16,24

12,40

10,88

10,05

9,52

9,16

8,89

8,68

8,18

7,65

7,08

8

14,69

11,04

9,60

8,81

8,30

7,95

7,69

7,50

7,01

6,50

5,95

9

13,61

10,11

8,72

7,96

7,47

7,13

6,88

6,69

6,23

5,73

5,19

10

12,83

9,43

8,08

7,34

6,87

6,54

6,30

6,12

5,66

5,17

4,64

12

11,75

8,51

7,23

6,52

6,07

5,76

5,52

5,35

4,91

4,43

3,90

14

11,06

7,92

6,68

6,00

5,56

5,26

5,03

4,86

4,43

3,96

3,44

16

10,58

7,51

6,30

5,64

5,21

4,91

4,69

4,52

4,10

3,64

3,11

18

10,22

7,21

6,03

5,37

4,96

4,66

4,44

4,28

3,86

3,40

2,87

20

9,94

6,99

5,82

5,17

4,76

4,47

4,26

4,009

3,68

3,22

2,69

30

9,18

6,35

5,24

4,62

4,23

3,95

3,74

3,58

3,18

2,73

2,18

40

8,83

6,07

4,98

4,37

3,99

3,71

3,51

3,35

2,95

2,50

1,93

60

8,49

5,79

4,73

4,14

3,76

3,49

3,29

3,13

2,74

2,29

1,69

120

8,18

5,54

4,50

3,92

3,55

3,28

3,09

2,93

2,54

2,09

1,43

¥

7,88

5,30

4,28

3,72

3,35

3,09

2,90

2,74

2,36

1,90

1,00


 

 dove

-  la varianza maggiore () è posta al numeratore,

-  la varianza minore () è posta al denominatore,

 in modo tale che il risultato è sempre .

Si rifiuta l’ipotesi nulla alla probabilità a, quando

-  il valore F calcolato è superiore al valore critico, riportato dalla tabella alla probabilità a/2,

-  per i gradi di libertà corrispondenti alla varianza posta al  numeratore e a quella al denominatore.

In termini più specifici, nel caso di un test bilaterale,

- se la probabilità prescelta è a = 0.05 il valore critico di  è quello della tabella a = 0.025,

- se la probabilità prescelta è a = 0.01 il valore critico di  è quello della tabella a = 0.005

 

Nel caso di un’ipotesi unilaterale, quale

H0:           contro          H1:

 dove

- a priori si è stabilito, ad esempio, che si vuole verificare se la varianza del campione 2 sia effettivamente maggiore di quella del campione 1,

 si utilizza il rapporto

  e si confronta il valore F ottenuto con quello critico, riportato nella tabella di probabilità a, con

-  df  =  al numeratore

-  df  =  al denominatore.

Se rispetto a quello critico il valore F calcolato

- è maggiore, si rifiuta l’ipotesi nulla H0:  e si accetta H1: ;

- è minore, si accetta l’ipotesi nulla H0:

I valori riportati nelle tabelle sono sempre maggiori di 1.

Quindi, se risulta , automaticamente l’ipotesi nulla è accettata. Tuttavia, se era ragionevolmente atteso che il risultato sperimentale fosse , sarebbe utile:

-  verificare se l’esperimento è stato condotto in modo corretto,

-  scoprire quale sia il motivo di una risposta opposta a quella attesa.

Se l'ipotesi espressa a priori è nella direzione opposta rispetto quella formulata in precedenza, l'unica differenza consiste nello scambio tra numeratore e denominatore.

 

ESEMPIO 1 (TEST BILATERALE). Per accertare se i prodotti di due aziende hanno una variabilità statisticamente differente, su 9 campioni della prima azienda si è ottenuto  = 2,39 e su 13 campioni della seconda azienda  = 5,67.

Verificare se effettivamente le due varianze sono differenti, alla probabilità = 0.05

 

Risposta. Per verificare alla probabilità complessiva = 0.05 l’ipotesi bilaterale

H0:           contro          H1:

il test F è fondato sul rapporto tra la varianza maggiore e quella minore.

Con i dati dell’esempio

 si ottiene F = 2,37 con df  = 12 al numeratore e df = 8 al denominatore.

Nella tabella dei valori critici per = 0.025 e con df = 12 al numeratore e df =  8 al denominatore, è riportato il valore 3,51. Il valore calcolato (2,37) è sensibilmente inferiore: si accetta l’ipotesi nulla H0, in quanto non si hanno elementi sufficienti per rifiutarla, nonostante il fatto che una varianza sia più del doppio dell’altra.

 

ESEMPIO 2  (TEST UNILATERALE). La costanza dei parametri è uno degli indici fondamentali di buona qualità di un prodotto industriale. In una azienda farmaceutica, per valutare il miglioramento nell'emissione di uno spray, è stata misurata la varianza di 20 bombolette del vecchio tipo ottenendo . Con 60 bombolette di nuova produzione, il risultato è stato  = 0,56.

Il miglioramento è statisticamente significativo?

 

Risposta. E' un test unilaterale, nel quale si vuole dimostrare che la seconda produzione ha una varianza reale  minore. In termini più formali,

 si vuole verificare l'ipotesi

H0:           contro          H1:

 

Con i dati dell’esempio, si applica il test

 = 2,25

 ottenendo  = 2,25 con gradi di libertà (come indicano i due numeri tra parentesi) 19 al numeratore e 59 al denominatore.

Non disponendo di tabelle dettagliate, che devono essere cercate su testi specifici o sono fornite dai programmi informatici, in quelle precedenti prendiamo come valore molto prossimo al reale quello con 20 gradi di libertà al numeratore e 60 al denominatore. In realtà si dovrebbe fare una interpolazione tra i dati disponibili.

Poiché il test è unilaterale, la probabilità  fornita dalla tabella è quella complessiva.

Nella tabella dei valori critici, per i gradi di libertà 20 e 60

- alla probabilità a = 0,025  corrisponde il valore  = 1,94

- alla probabilità a = 0,01  corrisponde il valore  = 2,20

- alla probabilità a = 0,005  corrisponde il valore  = 2,39

Il valore calcolato deve essere confrontato con quello della probabilità minore che risulta significativa. Con i dati dell'esempio, il valore calcolato (2,25) è maggiore di quello critico (2,20), corrispondente alla probabilità a = 0,01. Pertanto con probabilità P < 0,01 di commettere un errore di I tipo, si rifiuta l'ipotesi nulla H0 e implicitamente si accetta l'ipotesi alternativa H1. La conclusione tecnica è che la nuova produzione ha una variabilità di emissione della quantità di spray che è significativamente più costante della produzione precedente.

 

RAPPORTI TRA  E

Per verificare la significatività della differenza tra una varianza campionaria (), estratta da una popolazione distribuita in modo normale, e una varianza attesa ()

 

 

 si è utilizzata la distribuzione   con gradi di libertà .

Per verificare la significatività della differenza tra due varianze campionarie, calcolate su due campioni indipendenti estratti da due popolazioni distribuite in modo normale,


 

 si è  utilizzata la distribuzione  

- con gradi di libertà con gradi di libertà , sia per la varianza maggiore () sia per quella minore ().

 

Per comprendere quale relazione sussista tra  e  è sufficiente osservare che

 nella formula del  

- al numeratore è riportato il prodotto della varianza per  

-  al denominatore è riportata la varianza della popolazione (), che ovviamente ha gdl infiniti.

Pertanto, alla stessa probabilità a,

 esiste la relazione

 che

- il  con gdl =  quando viene diviso per i suoi gdl

- è uguale al valore di  con gdl =  al numeratore e  al denominatore

Ad esempio, nelle rispettive tabelle dei valori critici, alla probabilità complessiva a = 0.05,

- il valore di  alla probabilità a = 0.025 bilaterale con gdl = 24 è uguale a 39,364

- il valore di  probabilità a = 0.05 unilaterale con gdl 24 e  ¥  è uguale a 1,64

Da questi dati si può facilmente ricavare che

 i due valori ( e ) coincidono.

Anche questa uguaglianza

-  tra il valore di alla probabilità a = 0.025 bilaterale

-  e il valore di  probabilità a = 0.05 unilaterale

 è una dimostrazione che i valori di F riportati nelle tabelle sono per una probabilità unilaterale.


VALORI DI  PER  a > 0.5

La distribuzione dei valori  è asimmetrica e abitualmente di essi è presa la parte nella coda destra, corrispondenti a probabilità a piccole, comunque sempre P < 0.5, che hanno valori sempre maggiori di 1 . In alcune situazioni, può avvenire che sia richiesto il valore di  nell’altra coda della distribuzione, vale a dire per probabilità  a > 0.5 .

Poiché non sono riportati in tabelle specifiche, se non in pubblicazioni altamente specializzate, può essere utile ricavarli dai valori critici abituali, riportati nelle tabelle di uso comune.

A tale scopo, scambiando i gdl tra numeratore e denominatore,  è utile calcolare il reciproco,

 vale la relazione

 dove

a =  probabilità nella coda destra, ad esempio P = 0.05

1- a =  probabilità corrispondente nella coda sinistra, ad esempio P = 0,95

n1  e  n2 = gradi di libertà del numeratore e del denominatore, che devono essere scambiati.

 

ESEMPIO 3. Stimare il valore di F per la probabilità P = 0.95 con gdl 9 al numeratore e 4 al denominatore.

Risposta.  Dalla tabella dei valori critici, per la probabilità P = 0.05 con gdl 4 al numeratore e 9 al denominatore il valore di F è 3,63.

Da

 (con simboli non ridotti a pedice per meglio leggere i dati)

 si ricava che per la probabilità P = 0.95 con gdl 9 al numeratore e 4 al denominatore

 il valore di F è 0,275.

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007