analisi FATTORIALE E  disegni complessi

CON FATTORI INCROCIATI

 

 

 

12.6.   ESPERIMENTI FATTORIALI 2 x 2 E 2 x 2 x 2 CON I CONFRONTI ORTOGONALI

 

 

I metodi per calcolare le devianze ed i relativi gdl, nei disegni complessi a più fattori in cui si analizzano anche le interazioni, sono numerosi. In vari testi di statistica applicata dei decenni scorsi, è riportato anche il metodo dei confronti ortogonali; erano di grande utilità soprattutto in un periodo in cui i calcoli erano svolti manualmente, al massimo con l’aiuto delle calcolatrici da tavolo, per ridurre la probabilità di errori e abbreviare i tempi necessari. Ora, con i risultati ottenuti mediante programmi informatici, per i quali si richiede solo una corretta impostazione dell’input, diventa essenziale comprendere quali concetti sono alla base delle varie analisi, come si devono interpretare gli output e quale è l’esatto significato dei risultati ottenuti.

A questo fine, come generalizzazione dei metodi già presentati per due fattori con repliche, è utile considerare due casi semplici: un esperimento fattoriale 2 x 2 ed uno, relativamente più complesso, di 2 modalità per 3 fattori (23).

 

In un esperimento fattoriale 2 x 2 (cioè 2 modalità  x  2 fattori  =  4 trattamenti), il fattore A ed il fattore B hanno due sole modalità: assente (a0 e b0) e presente (a1 e b1) oppure dose minima (a1 e b1) e dose massima (a2 e b2); di solito i dati sono riportati in una tabella come quella sottostante

 

 

Fattore   A

Fattore   B

Repliche

Repliche

Repliche

Repliche

 

 

Questo disegno sperimentale non deve essere confuso con quello del test c2 in tabelle 2 x 2, che serve per valutare l’associazione, mediante il confronto di frequenze o conteggi di variabili qualitative o nominali. In questo disegno 2 x 2, entro ogni casella sono riportate non le frequenze ma tante misure quante sono le repliche.

Dai confronti tra le 4 medie o i 4 totali (poiché è richiesto un numero di repliche sempre costante), si può stimare la devianza tra trattamenti con 3 gdl; successivamente, è possibile la sua scomposizione in 3 devianze, ognuna con 1 gdl.

 

 

ESEMPIO.  Con un esperimento di tossicologia sulla crescita di semi, si vogliono valutare gli effetti indipendenti e quelli congiunti di una sostanza (presenza o assenza) e di due diversi livelli di temperatura (20 gradi e 25 gradi).

A questo fine sono stati coltivati 4 gruppi di semi, ognuno con 5 unità o repliche, posti in 4 situazioni differenti:

- il primo gruppo di semi a temperatura di 20° C e senza la sostanza tossica (a1b1);

- il secondo gruppo alla temperatura di 20° C e con la presenza della sostanza tossica (a2b1);

- il terzo alla temperatura di 25° C e senza la sostanza (a1b2);

- il quarto alla temperatura di 25° C e con la presenza della sostanza (a2b2).

 

Dopo un mese, sono state misurate le crescite (in mm) di ogni seme:

 

 

 

Sostanza  (A)

Temperatura  (B)

Assente  

Presente  

 

 

  (20° C)

10

12

8

12

9

8

6

8

5

7

 

 

  (25 ° C)

15

15

12

14

13

7

5

7

8

10

 

 

Valutare se si è manifestato un effetto significativo dei due fattori e se tra loro esiste interazione.

 

Risposta.   Come primo passaggio è utile calcolare le somme

 

GRUPPO

Totale

Somma

51

34

69

37

191

 

 

dei 4 gruppi e quella totale.

Con esse è possibile stimare:

- la devianza totale

(102+ 122 + 82 + 122 +    + 52 + 72 + 82 + 102) - 1912/20 = 2017 - 1824 = 192,95

che risulta uguale a 192,5 ed ha 19 gdl,

 

- la devianza tra i 4 trattamenti

512/5 + 342/5 + 692/5 + 372/5 - 1912/5  =  520,2 + 231,2 + 952,2 + 273,8 - 1824,05  =  153,35

che risulta uguale a 153,35 ed ha 3 gdl.

 

- la devianza d’errore, come somma dei quadrati delle differenze di ogni replica rispetto alla media del suo gruppo o, più rapidamente, per differenza,

192,95 - 153,35 = 39,6

che risulta uguale a 39,6 ed ha 16 (19-3) gdl.

 

La tabella di sintesi, che riporta anche il valore di F e la sua significatività,

 

 

DEVIANZA

DF

VARIANZA 

F

P

Totale

192,95

19

---

---

---

Tra Trattamenti

153,35

3

51,11

20,65

< 0.001

Errore

39,6

16

2,475

---

---

 

 

evidenzia che tra i 4 trattamenti esiste una differenza significativa.

La sua scomposizione in tre devianze, ognuna con 1 df, è possibile con una metodologia che non si discosta da quella già utilizzata, ma richiama l’approccio dei confronti ortogonali e permette di meglio comprendere sia l’effetto di ognuno dei due fattori che quello della loro interazione.

Tale regola di scomposizione della devianza tra trattamenti segue lo schema seguente


 

GRUPPO

Somma

51

34

69

37

Fattore A

-1

+1

-1

+1

Fattore B

-1

-1

+1

+1

Interazione AB

-1

+1

+1

-1

 

dove i gruppi con lo stesso segno devono essere sommati tra loro, per formare due gruppi per ogni confronto.

 

Per stimare la devianza dovuta al fattore A, tutti i dati devono essere riuniti in due soli gruppi: in uno (-1) quelli che sono indicati con a1 (totale = 51+69 = 120) e nell’altro (+1) quelli con a2 (totale = 34 + 37 = 71).

Se fosse vera l’ipotesi nulla (cioè se il fattore A non ha un effetto significativo), le due somme dovrebbero essere uguali (ricordando che tutti i gruppi hanno lo stesso numero di dati).

Con la formula abbreviata, tale devianza con 1 df è data da

  =  1440 + 504,1 - 1824,05  =  120,05

e risulta uguale a 120,05.

 

Per stimare la devianza dovuta al fattore B, devono essere riuniti in un gruppo (-1) quelli che sono indicati con  (totale = 51 + 34 = 85) e nell’altro (+1) quelli con  (totale = 69 + 37 = 106).

Una differenza tra le due somme che risulti minore (oppure maggiore) della precedente indica che l’effetto del fattore B è minore (oppure maggiore) di quello di A. Per una valutazione corretta della significatività di tali effetti, si calcola la devianza

  =  722,5 + 1129,6 - 1824,05  =  22,05

che risulta uguale a 22,05 ed ha 1 df.

 

La devianza dell’interazione A x B è ottenuta mediante il confronto tra la somma dei gruppi (-1) in cui A e B sono assenti o presenti in modo congiunto (  e    con totale = 51 + 37 = 88) rispetto a quella dei gruppi (+1) in cui A e B sono presenti separatamente (  e    con totale = 34 + 69 = 103).

Infatti, se non esistesse interazione e quindi gli effetti di A e B fossero solo additivi, la somma in cui A e B compaiono separatamente dovrebbe essere uguale a quella in cui tali fattori non compaiono o sono presenti contemporaneamente (sempre quando il numero di repliche è uguale in ogni gruppo).

La differenza tra le due somme indica anche se l’effetto è di

-          inibizione, se la somma delle osservazioni in cui non compaiono oppure sono presenti in modo congiunto è minore,

-          potenziamento, se questa somma è maggiore di quella dei valori in cui i due fattori sono presenti separatamente.

Con i dati dell’esempio, la devianza d’interazione è data da

  =  774,4 + 1060,9 - 1824,05  =  11,25

e risulta uguale a 11,25 con 1 df.

 

I risultati delle 3 devianze e dei valori di F con la loro significatività possono essere riportati in una tabella conclusiva, che evidenzia come la somma delle 3 devianze (A, B, AB) sia uguale a quella tra trattamenti e ne rappresenti la scomposizione.

L‘effetto del fattore A, del fattore B e la loro interazione, utilizzando i dati dell’esempio sono verificati mediante un test F con df 1 e 16, il cui valore critico alla probabilità a = 0.05 è uguale a 4,49 e alla probabilità a = 0.01 è uguale a 8.86.

In conclusione sulla crescita  dei semi, come risulta nella tabella seguente,

-          la presenza della sostanza A inibisce la crescita in modo altamente significativo (< 0.001);

-          la temperatura maggiore favorisce la crescita in modo molto significativo (< 0.01);

-          l’alta temperatura potenzia l’effetto di riduzione del fattore A in modo significativo (con probabilità leggermente inferiore a 0.05)

 

 

DEVIANZA

DF

VARIANZA

F

P

Totale

192,95

19

---

---

---

Tra Trattamenti

153,35

3

51,11

20,65

< 0.001

A

120,05

1

120,05

48,50

<0.01

B

22,05

1

22,05

8,90

<0.01

AB

11,25

1

11,25

4,54

<0.05

Errore

39,6

16

2,475

---

---

 

 

Con 2 modalità per 3 fattori (23), è possibile utilizzare lo stesso schema esteso a 8 gruppi. Per un’analisi impostata sulla presenza-assenza di 3 fattori (A, B, C), si richiedono 8 gruppi bilanciati, che possono essere presentati come nell’ANOVA ad un criterio di classificazione

 

 

T R A T T A M E N T I

Repliche

Repliche

Repliche

Repliche

Repliche

Repliche

Repliche

Repliche

 

 

Il modello è

 dove

-  indicano gli effetti principali,

-  indicano le interazioni di primo ordine od interazioni a due fattori,

-  indica l’interazione di secondo ordine o interazione a tre fattori,

-  indica l’errore o residuo di ogni dato o replica.

 

La devianza totale (che con k repliche ha gdl (8 x k) –1),

 la devianza tra trattamenti (con gdl 8-1) e

 la devianza d’errore (con gdl 8 x (k-1))

 possono essere calcolati come nell’analisi della varianza ad un criterio.

La devianza tra trattamenti ( con 7 gdl) può essere scomposta in

- 3 effetti principali,

- 3 interazioni di primo ordine,

- 1 interazione di secondo ordine

mediante una scomposizione ortogonale, rappresentata in uno schema,

 


 

 

T R A T T A M E N T I

FATTORI   E

INTERAZIONI

A

-1

+1

-1

-1

+1

+1

-1

+1

B

-1

-1

+1

-1

+1

-1

+1

+1

C

-1

-1

-1

+1

-1

+1

+1

+1

AB

+1

-1

-1

+1

+1

-1

-1

+1

AC

+1

-1

+1

-1

-1

+1

-1

+1

BC

+1

+1

-1

-1

-1

-1

+1

+1

ABC

-1

+1

+1

+1

-1

-1

-1

+1

 

 

 dove +1  e -1  indicano i trattamenti che devono essere sommati tra loro, per formare ogni volta i due gruppi che devono essere confrontati.

La logica con cui si raggruppano i trattamenti è semplice:

- per ognuno dei 3 effetti principali (A, B, C) si sommano tra loro i trattamenti in cui il fattore è assente (-1) e quelli in cui è presente (+1);

- per le interazioni di primo ordine (AB, AC, BC) si sommano tra loro i trattamenti in cui è presente un solo fattore (-1) e quelli in cui o sono assenti entrambi o sono entrambi presenti (+1);

- per l’interazione di secondo ordine (ABC) si sommano tra loro i trattamenti in cui i tre fattori sono presenti singolarmente o tutti insieme (+1) e tra loro quelli in cui o sono tutti assenti o sono presenti a coppie (-1).

Per ognuno dei 7 confronti è possibile calcolare la devianza relativa, con 1 df, che è data da

 

 dove

-  tot + = totale del gruppo i cui trattamenti sono indicati con +

-  tot -  = totale del gruppo i cui trattamenti sono indicati con -

-  n+  = numero complessivo delle repliche contenute nel gruppo +

-  n-  = numero complessivo delle repliche contenute nel gruppo -

-  TOT  = somma di tutti i dati

-  n  = numero complessivo di dati o repliche.

 

ESEMPIO.  Per analizzare gli effetti della presenza-assenza di tre sostanze e delle loro interazioni sulla crescita di cavie, sono stati formati 8 gruppi, ognuno di 4 individui. Per un mese, ad ogni gruppo sono state somministrate con il cibo le 3 sostanze a due diversi livelli, secondo lo schema ed i risultati di seguito riportati

 

 

 

T R A T T A M E N T I

 

 

Repliche

5,6

6,7

6,9

6,5

7,8

7,4

7,6

7,6

6,2

6,6

7,0

7,1

7,5

7,2

7,9

7,9

4,5

7,3

7,2

5,8

6,1

6,5

6,9

6,3

5,2

5,9

6,8

6,0

7,6

7,3

8,1

7,0

Totale

21,5

26,5

27,9

25,4

29,0

28,4

30,5

28,8

 

 

 in cui le lettere dei trattamenti indicano le sostanze aggiunte nel cibo somministrato e 0 è il controllo.

Calcolare la devianza tra gli 8 trattamenti e la sua scomposizione nei 7 confronti ortogonali, al fine di valutare

- gli effetti dei 3 fattori,

- le loro interazioni di primo ordine e

- quella di secondo ordine.

Risposta.

Ricordando che la somma totale dei 32 dati è uguale a 218,

la devianza tra trattamenti è data da

 

(21,52 + 26,52 + 27,92 + 25,42 + 29,02 + 28,42 + 30,52 + 28,82)/4  -  2182/32  =

(462,25 + 702,25 + 778,41 + 645,16 + 841 + 806,56 + 930,25 + 829,44)/4  -  47524/32  =

1498,83 - 1485,125 = 13,705

e risulta uguale a 13,705 con 7 df.

 

Per la sua scomposizione, è utile costruire la tabella dei confronti ortogonali

 

 

 

21,5

26,5

27,9

25,4

29,0

28,4

30,5

28,8

Totale

+

Totale

-

Diff.

A

-

+

-

-

+

+

-

+

112,7

105,3

7,4

B

-

-

+

-

+

-

+

+

116,2

101,8

14,4

C

-

-

-

+

-

+

+

+

113,1

104,9

8,2

AB

+

-

-

+

+

-

-

+

104,7

113,3

-8,6

AC

+

-

+

-

-

+

-

+

106,6

111,4

-4,8

BC

+

+

-

-

-

-

+

+

107,3

110,7

-3,4

ABC

-

+

+

+

-

-

-

+

108,6

109,4

-0,8

 

 

 con i totali dei due gruppi di trattamenti segnati con + e con -.

La devianza del fattore A, con 1 df,  riportata come prima nella tabella è data

 

  =  793,83 + 693,01 - 1485,12 = 1,72

e così ogni fattore od interazione fino a quella di secondo ordine (ABC), riportata alla fine della tabella

Per una lettura più facile e una visione d’insieme, questi risultati sono riassunti in una tabella

 

Fonte di variazione

DEVIANZA

DF

Tra trattamenti

13,705

7

A

1,72

1

B

6,48

1

C

2,11

1

AB

2,32

1

AC

0,72

1

BC

0,37

1

ABC

0,02

1

 


 

per evidenziare che

- la loro somma corrisponde a quella tra trattamenti (a meno delle approssimazioni dei calcoli) e

- a differenze maggiori tra i due gruppi (+ e -) corrispondono ovviamente valori di devianza maggiori.

Per stimare la significatività occorre naturalmente procedere ai test F, mediante il rapporto di ognuna delle 7 varianze con la varianza d’errore.

 

 

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007