L’ANALISI GERARCHICA E

LE COMPONENTI DELLA VARIANZA

 

 

 

14.4.   DISEGNI CON FATTORI NESTED E FATTORI CROSSED

 

 

In un esperimento con molti fattori, può capitare che alcuni siano nested ed altri siano crossed. Tale situazione in alcuni testi è chiamata designs with nested and crossed factor, in altri nested-factorial designs. In essi è possibile l’analisi delle interazioni, ma solo per i fattori i cui livelli incrociano tutti i livelli dell’altro fattore, cioè sono tra loro crossed. Anche in questo caso è necessario utilizzare programmi informatici, per evitare errori che sono sempre frequenti, quando i calcoli richiesti sono molto lunghi.

Come schema di riferimento è utilizzato l’esempio riportato da Douglas C. Montgomery nel suo testo del 1976 (Design and Analysis of Experiments, John Wiley & Sons, New York, pp. 418).

In esso, non sostanzialmente differente dall’esempio del paragrafo precedente, sono state riportate le formule e i relativi risultati, in modo da favorire ulteriormente, con una dimostrazione completa di tutti i passaggi logici e metodologici, la comprensione di queste tecniche che per alcuni aspetti si differenziano da quelle crossed.

Si supponga che, per un esperimento nel campo della chimica ambientale, sia stato programmato

-   il confronto tra la qualità dell’acqua fornita da 2 acquedotti (A e B),

-   scegliendo a caso 4 pozzi (I, II, III, IV) e

-  con 2 misure in ogni pozzo per tre anni consecutivi (1, 2, 3),

ottenendo i seguenti dati (con totali relativi):

 

 

 

Acquedotto  A

Acquedotto  B

Totale

Anno

Pozzo

I

II

III

IV

Totale

I

II

III

IV

Totale

Anno  1

 

22

24

23

24

28

29

25

23

 

198

26

28

27

25

28

25

24

23

 

206

 

404

Anno 2

 

30

27

29

28

30

32

27

25

 

228

29

28

30

27

24

23

28

30

 

219

 

447

Anno 3

 

25

21

24

22

27

25

26

23

 

193

27

25

26

24

24

27

28

27

 

208

 

401

T. Pozzi

149

150

171

149

 

163

159

151

160

 

 

Totale

Acqued.

 

619

 

633

 

1252


 

Il modello lineare o additivo di ANOVA I è

 con                    

 e  dove

-    sono gli effetti principali,

-    è l’interazione tra tempo e acquedotti (cioè una differente evoluzione dei parametri dei pozzi nel tempo),

-   è l’interazione tra tempo e pozzi (entro acquedotti).

E’ stata omessa, in quanto non può esistere, l’interazione  poiché pozzi e acquedotti non sono crossed ma nested; per lo stesso motivo, non può esistere neppure quella a tre fattori .

 

Con  a tempi, b acquedotti, c pozzi, n repliche e i dati riportati nella tabella (T = 1252),

-   la devianza totale

 

 

 risulta SQTot = 299,7 con df = 47;

-   la devianza tra tempi

 

 

 

 risulta = 82,79 con df = 2;

-   la devianza tra acquedotti

 


 

 

 risulta = 4,08 con df = 1;

-   la devianza tra pozzi (entro acquedotti)

 

 

 

 

 risulta = 71,93 con df = 6 ottenuti da 2×(4-1);

-   la devianza di interazione tempi per acquedotti

 

 

 

risulta = 19,05 con df = 2, corrispondenti ai 6 totali tempi x acquedotti (quindi df=5) ai quali sono stati sottratti 1 df degli acquedotti e 2 df dei tempi

-   la devianza di interazione tempi per pozzi (entro acquedotti) è

 

 

Dopo aver calcolato i totali delle misure che appartengono allo stesso tempo e allo stesso pozzo


 

 

Acquedotto  A

Acquedotto  B

Totale

Anno

Pozzo

I

II

III

IV

Totale

I

II

III

IV

Totale

Anno  1

46

47

57

48

198

54

52

53

47

206

404

Anno 2

57

57

62

52

228

57

57

47

58

219

447

Anno 3

46

46

52

49

193

52

50

51

55

208

401

T. Pozzi

149

150

171

149

 

163

159

151

160

 

 

Totale

Acqued.

 

619

 

633

 

1252

 

 

 si stimano le 4 quantità della somma precedente

 

 

 

 

 

Da essi si ottiene la stima della devianza di interazione tempi per pozzi (entro acquedotti)

 

 

 che risulta  = 65,82 con df = 12 determinati da b×(a-1)×(c-1) = 2×(3-1)×(4-1);

-   la devianza di errore e i suoi df, ricavati mediante la loro proprietà additiva, seguendo il modello del disegno sperimentale applicato

 

Con i dati dell’esempio, la devianza d’errore

 = 299,70 - 82,79 - 4,08 - 71,93 –19,05 – 65,82 = 56,03

 risulta  = 56,03 e i suoi gradi di libertà

df = 47 – 2 – 1 – 6 – 2 – 12 = 24

 sono df = 24.

 

Per una visione complessiva e un confronto più rapido, nei tesi e nei programmi informatici i risultati sono riportati in una tabella:

 

 

Fonte di variazione

Devianza

DF

Varianza

F

Totale

299,70

47

---

---

Tempi

82,79

2

41,40

7,54**

Acquedotti

4,08

1

4,08

0,34

Pozzi (entro Acquedotti)

71,93

6

11,99

5,15**

Interazione Tempi x Acquedotti

19,05

2

9,53

1,74

Interazione Tempi x Pozzi (entro Acq.)

65,82

12

5,49

2,36*

Errore

56,03

24

2,33

---

 

 

 che offre anche il vantaggio di evidenziare le varianze, il risultato di ogni test F e la sua significatività.

Nell’analisi nested, soprattutto in un disegno sperimentale abbastanza complesso come questo, occorre porre attenzione a come nei vari test F deve essere scelta la varianza da porre al denominatore, pure seguendo la logica semplice presentata nei paragrafi precedenti.

 

1- L’ipotesi sulla differenza tra le medie dei tempi come varianza al denominatore deve utilizzare quella derivata dal suo livello inferiore, cioè tempi x pozzi, poiché è quella che misura la variabilità nel tempo; pertanto dal rapporto

 si ottiene un valore F = 7,54 che, con df 2 e 12, risulta significativo alla probabilità a < 0.01.

 

2 - L’ipotesi sulla differenza tra le medie degli acquedotti come varianza al denominatore deve utilizzare quella del suo livello immediatamente inferiore, cioè quella tra pozzi; si ottiene

 un F = 0,34 che ha df 1 e 6. E’ un valore minore di 1 e quindi non significativo.

Questo valore così basso potrebbe suggerire che forse i pozzi sono stati scelti dai responsabili dell’acquedotto non in modo casuale, ma con lo scopo preciso di compensare le caratteristiche chimiche delle loro acque, in modo tale che le medie dei due acquedotti risultino tra loro simili.

 

3 - L’ipotesi sulla differenza tra le medie dei pozzi entro acquedotti come varianza al denominatore deve utilizzare quella del suo livello immediatamente inferiore, cioè quella calcolata sulla variabilità delle due analisi per ogni pozzo; si ottiene

 un valore F = 5,15 che, con df 6 e 24, risulta significativo alla probabilità a < 0.01.

 

4 - L’ipotesi sulla esistenza dell’interazione tempi x acquedotti, cioè di medie annuali dei due acquedotti che hanno una evoluzione differente nel tempo, come varianza ad denominatore deve utilizzare quella derivata dal suo livello immediatamente inferiore, cioè tempi x pozzi; si ottiene

 un valore F = 1,74 che, con df 2 e 12, non è significativo.

 

5 - L’ipotesi sulla interazione tempi x pozzi (entro acquedotti), utile per valutare se le medie annuali dei quattro pozzi hanno una evoluzione differente nel tempo tra i due acquedotti, come varianza al denominatore deve utilizzare quella del suo livello inferiore, cioè quella d’errore derivata dalla variabilità entro ogni pozzo; si ottiene

un valore F = 2,36 che, con df 12 e 24, risulta significativo alla probabilità a < 0.05.

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007