analisi FATTORIALE E  disegni complessi

CON FATTORI INCROCIATI

 

 

 

12.8.   TEST DI TUKEY PER LA NON-ADDITIVITA’ CON 1 DF

 

 

Nell’ANOVA a due o a più criteri di classificazione, in varie situazioni non è possibile disporre di repliche, ma di un dato solo per cella. Nel caso più semplice di due soli fattori (A e B), come precedentemente illustrato, il modello additivo o lineare è

Xij = m + ai + bj + Rij

 dove Rij ingloba

-          sia la variabilità d’errore vera e propria, comprendente errori di misura, variabilità biologica allo stimolo e soprattutto gli altri fattori non considerati,

-          sia la variabilità d’interazione abij

 poiché in questo disegno sperimentale le due diverse quote  non sono tra loro distinguibili mediante i metodi classici, illustrati in precedenza.

Con

-          k livelli dei trattamenti e

-          p livelli dei blocchi,

 la metodologia ANOVA classica permette di scomporre le devianze e i rispettivi gdl secondo lo schema

 

Devianza

DF

Varianza

Totale

N-1

---

Tra Trattamenti

k-1

Tra Blocchi

p-1

Errore

(k-1)×(p-1)

 

Se esiste interazione (), la varianza d’errore () diventa maggiore di quella reale. Ne deriva che più difficilmente con i due test F risultano significative le differenze tra

-          le medie dei trattamenti,

-          le medie dei blocchi.

Soprattutto è in discussione la stessa validità di questi test F, poiché

-          il modello additivo o lineare non è più valido,

-          e/o i residui non sono più distribuiti normalmente.

 

E’ possibile ricostruire le condizioni di validità attraverso la trasformazione dei dati, nella parte finale del capitolo. Ma per una corretta valutazione dei suoi effetti, è necessario quantificare e verificare l’esistenza di questo tipo di interazione prima e dopo la trasformazione effettuata. Si parla perciò di non-additività trasformabile (transformable non-additivity). Se essa persiste anche dopo vari tentativi, eventualmente con l’aiuto del test di Box-Cox per cercare quella più adeguata, è in discussione la validità del test F.

Nel 1949 John W. Tukey (con l’articolo One degree of freedom for non additivity, pubblicato su Biometrics vol. 5, pp. 232-242) propone un metodo che

-          quantifica questa devianza d’interazione,

-          che a 1 df, sottraendolo a quella d’errore.

 

In una ANOVA a due criteri senza repliche, nel caso di interazione il modello diventa

xij = m + ai + bj + Dabij + eij

Utilizzando la simbologia consueta, è possibile ottenere una stima dell’interazione , con la formula

 

 

che, seppure nella forma abbreviata, riesce ad evidenziare come l’analisi sia concentrata sugli scarti delle medie di riga e di colonna dalla media generale.

 

Da , si perviene alla devianza d’interazione  con

 

 

Sottraendo alla devianza d’errore  con df (k-1)×(p-1)

-          la devianza d’interazione  con 1 df,

-          si ricava la devianza d’errore rimanente o Residuo  (da Remainder, così chiamata in vari testi; chiamata Balance come da Tukey nell’articolo citato)

I gradi di libertà della  sono (k-1) × (p-1) - 1 = k × p – k - p

 

In questo disegno sperimentale, la tabella completa delle devianze, dei gdl e delle varianze diventa

 

Devianza

DF

Varianza

Totale

N-1

---

Tra Trattamenti

k-1

Tra Blocchi

p-1

Errore

(k-1)×(p-1)

Interazione AB

1

Remainder

k×p-k-p

 

(Errore e Remainder sono sinonimi; qui i due termini sono stati distinti, per evidenziare la diversa fonte d’errore che essi indicano,

 

Infine, si verifica se l’interazione è significativa.

In modo più formale, si testa l’ipotesi nulla

H0: D = 0    (non esiste l’interazione tra i fattori A e B)

 contro l’ipotesi alternativa bilaterale

H1: D ¹ 0    (esiste interazione tra i fattori A e B)

Con la solita metodologia, avviene con il test F

 cioè il rapporto tra

-          la varianza d’interazione o della non-additivita trasformabile e

-          la varianza remainder o balance,

-          con df che rispettivamente sono 1   e   k×p – k - p

-          per la probabilità a prescelta.

Questa probabilità spesso è superiore a 0.05, potendo ricorre a a = 0.10 oppure a = 0.20.

 

Se il test risulta significativo, è necessario applicare una trasformazione, in modo da annullare o ridurre la devianza d’interazione. Se essa resta significativa, l’ANOVA classica non è valida, comunque ha una potenza molto bassa.

In merito al test di verifica dell’interazione, permangono le perplessità già ripetutamente espresse per i test di omoschedasticità, dove si deve dimostrare che l’ipotesi nulla è vera: non rifiutare l’ipotesi nulla, non significa che essa sia vera.

La scelta conclusiva sulla attendibilità del test è quindi lasciata allo sperimentatore, che meglio conosce l’esistenza o meno della non-additività tra i fattori considerati e quindi sa distinguere tra un risultato accidentale e l’esistenza di un fenomeno reale. Come concetto molto generale, ritorna il problema che non è possibile separare l’analisi statistica dalla conoscenza esatta dello specifico problema ambientale, ecologico o biologico in discussione.

Nel suo articolo del 1949 Tukey ipotizzava che questa tecnica sarebbe stata facilmente estesa ad altri disegni sperimentali più complessi, data l’importanza del concetto di non-additività nelle condizioni di validità dell’ANOVA. In realtà nei testi internazionali a maggior diffusione compare solamente questa applicazione ai blocchi randomizzati; in quasi tutti i programmi informatici neppure questa. E’ quindi una verifica di validità che nella prassi della ricerca è quasi sempre dimenticata, seppure ritenuta importante nelle enunciazioni teoriche.

Gli esempi successivi sono tratti da testi a grande diffusione internazionale. E’ la logica sulla quale è stato costruito questo corso: illustrare in modo semplice ed applicativo le procedure riportate nei testi di riferimento dei rapporti scientifici e delle pubblicazioni internazionali.

 

 

ESEMPIO 1  (CON METODO DI TUKEY).  Nel testo di G. Box, W. Hunter e S. Hunter del 1978 (Statistics for Experimenters. An Introduction to Design, data Analysis and Model Building, John Wiley & Sons, New York, pp. 653) è presentato sinteticamente un esempio che, sviluppato in tutti i suoi passaggi, permette di comprendere la logica del metodo. E’ simile a quello riportato nell’articolo di Tukey, dove sono esposti concetti e metodologia.

 

In un esperimento con 4 trattamenti e 5 blocchi, con i valori osservati  ()


 

 

B

L

O

C

C

H

I

 

TRATTAMENTI

 

 

A

B

C

D

Media

I

89

88

97

94

92

II

84

77

92

79

83

III

81

87

87

85

85

IV

87

92

89

84

88

V

79

81

80

88

82

Media

84

85

89

86

= 86

 

 

l’ANOVA a due criteri di classificazione ha dato i risultati seguenti

 

Devianza

DF

Varianza

Totale

560

19

----

Tra Trattamenti

70

3

23,3

Tra Blocchi

264

4

66,0

Errore

226

12

18,8

 

 

Se non esiste interazione né variabilità casuale, i valori attesi () in ogni casella sono determinati solo dall’effetto dei due fattori considerati; quindi da

 

  e risultano

 

 

B

L

O

C

C

H

I

 

TRATTAMENTI

 

 

A

B

C

D

Media

I

90

91

95

92

92

II

81

82

86

83

83

III

83

84

88

85

85

IV

86

87

91

88

88

V

80

81

85

82

82

Media

84

85

89

86

= 86

 

 

La differenza tra i precedenti valori osservati () e questi valori attesi  determina i residui


 

 

 

TRATTAMENTI

 

B

A

B

C

D

Totale

L

I

-1  (1)

-3  (9)

(4)

(4)

 

O

II

(9)

-5  (25)

(36)

-4  (16)

C

III

-2  (4)

(9)

-1  (1)

(0)

C

IV

(1)

(25)

-2  (4)

-4  (16)

H

V

-1  (1)

(0)

-5  (25)

(36)

I

Totale

 

0 (226)

 

La somma dei quadrati di questi valori (riportati tra parentesi e in grassetto) corrisponde alla devianza d’errore (), uguale a 226 e con 12 gdl (5-1)×(4-1)

 

La devianza d’errore () è scomponibile in

-          una devianza di non-additività trasformabile () con 1 gdl e

-          una devianza rimanente (remainder o balance) () con 11 gdl.

Per ottenere la devianza della non-additività () si utilizza il quadrato () dei valori attesi () calcolati in precedenza,

 

 

B

L

O

C

C

H

I

 

TRATTAMENTI

 

 

A

B

C

D

Media

I

8100

8281

9025

8464

8467,5

II

6561

6724

7396

6889

6892,5

III

6889

7056

7744

7225

7228,5

IV

7396

7569

8281

7744

7747,5

V

6400

6561

7225

6724

6727,5

Media

7069,2

7238,2

7934,2

7409,2

=7412,7

 

 

 procedendo con essi come è stato fatto con i valori osservati ():

-          prima si calcolano le medie di colonna (), di riga () e totale ()

-          successivamente da esse si ricavano i valori attesi ().

Dalla media di colonna (), di riga () e totale (), attraverso la relazione

 si ottiene una nuova tabella di valori attesi


 

 

B

L

O

C

C

H

I

 

TRATTAMENTI

 

 

A

B

C

D

Media

I

8124

8293

8989

8464

8467,5

II

6549

6718

7414

6889

6892,5

III

6885

7054

7750

7225

7228,5

IV

7404

7573

8269

7744

7747,5

V

6384

6553

7249

6724

6727,5

Media

7069,2

7238,2

7934,2

7409,2

=7412,7

 

Infine quella delle differenze tra le due distribuzioni () e i loro quadrati (tra parentesi)

 

 

TRATTAMENTI

 

B

A

B

C

D

Totale

L

I

-24  (576)

-12  (144)

36  (1296)

(0)

 

O

II

12  (144)

(36)

-18  (324)

(0)

C

III

(16)

(4)

-6  (36)

(0)

C

IV

-8  (64)

-4  (16)

12  (144)

(0)

H

V

16  (256)

(64)

-24  (576)

(0)

I

Totale

 

(3696)

 

La devianza della non additività è determinata dalle relazioni tra due serie di residui o scarti dai valori medi di riga e di colonna.

La somma di questi ultimi quadrati (tra parentesi e in grassetto) determina il valore Q

Q =  = 3696

La somma del prodotto delle due tabelle dei residui

 

 

 

TRATTAMENTI

 

B

A

B

C

D

Totale

L

I

(-1 × -24)  24

(-3 × -12)  36

(2 × 36)  72

(2 × 0)  0

 

O

II

(3 × 12)  36

(-5 × 6)  –30

(6 × -18) –108

(-4 × 0)  0

C

III

(-2 × 4)  -8

(3 × 2)  6

(-1 × -6)  6

(0 × 0)  0

C

IV

(1 × -8)  -8

(5 × -4)  –20

(-2 × 12)  -24

(-4 × 0)  0

H

V

(-1 × 16)  -16

(0 × 8)  0

(-5 × -24) 120

(6 × 0)  0

I

Totale

 

86

 

 determina il valore di P

P =  = 86

 

Essi permettono di stimare la devianza della non-additività o di interazione SQAB attraverso il rapporto

 

La procedura, secondo le parole di Tukey, spiega perché questa devianza abbia solo 1 gdl: è ricavata dal prodotto delle deviazioni dalle medie di riga e dalle medie di colonna, la cui somma deve essere uguale a 0 sia per riga che per colonna, pertanto è 1 gdl ortogonale sia alle righe che alle colonne.

 

La devianza d’errore SQe può essere scomposta

-          nella devianza d’interazione o di non additività trasformabile e

-          nella devianza remainder o balance

 

Devianza

DF

Varianza

Errore

226,0

12

---

Non-additività

2,001

1

2,001

Remainder

223,999

11

20,364

 

 

Infine si deve applicare il test F, per verificare se la varianza della non-additività è significativa

 

In questo caso è inutile, in quanto il rapporto è inferiore a 1 e quindi il suo valore certamente non è significativo.

L’articolo di Tukey illustra anche come la presenza di dati anomali renda significativa la varianza della non-additività e come essa sia nulla quando la distribuzione è perfettamente normale.

 

 

ESEMPIO 2  (FORMULA ABBREVIATA CON MEDIE). Nel testo di John Neter, Michael H. Kutner, Christopher J. Nachtsheim e William Wasserman del 1996 (Applied Linear Statistical Models, 4th ed. WCB McGraw-Hill, Boston, pp. 1408) è riportato un esempio elementare, più scolastico che reale a causa dei pochi df, ma utile per illustrare la procedura con una formula abbreviata.

In un esperimento con 3 livelli dei trattamenti (A) e 2 livelli dei blocchi (B)


 

 

Trattamenti

 

 

1

2

3

Media

Blocco  I

140

210

220

190

Blocco II

100

180

200

160

Media

120

195

210

 = 175

 

 l’ANOVA ha dato i seguenti risultati

 

Devianza

DF

Varianza

Totale

11.750

5

----

SQA

9.300

2

4.650

SQB

1.350

1

1.350

Errore

100

2

50

 

In un disegno a due criteri (A e B) aventi k trattamenti e p blocchi, la devianza d’interazione SQAB con la formula abbreviata

 

 

 dove con i dati dell’esempio il numeratore è

 

 

 e il denominatore è

SQA = 9.300    SQB = 1.350    p = 2    k = 3

risulta

uguale a 87,1 con df = 1.

Poiché la devianza d’errore è risultata SQe = 100 con df = 2

La devianza remainder SQRem è

100 – 87,1 = 12,9

 uguale a 12,9 con df = 1.

Per verificare l’ipotesi nulla

H0: D = 0    (non esiste l’interazione tra i fattori A e B)

 contro l’ipotesi alternativa bilaterale

H1: D ¹ 0    (esiste interazione tra i fattori A e B)

 il testo citato  propone il test F

 che non risulta significativo nemmeno alla probabilità a = 0.10 benché la devianza d’interazione sia quasi 7 volte quella remainder.

Infatti l’esempio riportato in questo testo internazionale ha un numero di gdl troppo ridotto, per una valutazione attendibile dei parametri in gioco.

 

 

ESEMPIO 3 (FORMULA ABBREVIATA CON TOTALE)   Nel testo di Douglas C. Montgomery del 1976 (Design and Analysis of Experiments. John Wiley & Sons, New York, pp. 418) è proposta una formula ancor più rapida, applicata ad un esempio che permette di avere un numero minimo accettabile di df.

 

 

In una rilevazione dei livelli d’inquinamento in 5 località per 3 tempi

 

 

Località

 

A

B

C

D

E

Totali 

Tempo  I

5

4

6

3

5

23

Tempo  II

3

1

4

2

3

13

Tempo  III

1

1

3

1

2

8

Totali 

9

6

13

6

10

 = 44

 

 l’ANOVA ha dato o seguenti risultati

 

Devianza

DF

Varianza

Totale

36,93

14

----

Località (tratt.)

11,60

4

2,90

Tempi (blocchi)

23,33

2

11,67

Errore

2,00

8

0,25

 

Per calcolare la devianza della non-additività, con la solita simbologia

 la formula rapida proposta è

 

 

Utilizzando i dati dell’esempio, dopo aver calcolato

 

 si ricava

 

 SQnon-add = 0,0985

 e infine la devianza remainder

 che risulta SQRem = 1,9015 con df 7.

Per la verifica della significatività della non-additività o interazione, dopo aver calcolato le varianze

 

Devianza

DF

Varianza

Errore

2,0000

8

---

Non-additività

0,0985

1

0,0985

Remainder

1,9015

7

0,2716

 

 

 si applica il test F

 che risulta addirittura inferiore a 1. In questo caso, per la verifica della significatività delle differenze tra le medie dei trattamenti e quella dei blocchi è conveniente (avendo una varianza d’errore inferiore e numero di gdl maggiore) , oltre che corretto, utilizzare la procedura classica.


 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007