analisi FATTORIALE E disegni complessi CON FATTORI INCROCIATI
12.6. ESPERIMENTI FATTORIALI 2 x 2 E 2 x 2 x 2 CON I CONFRONTI ORTOGONALI
I metodi per calcolare le devianze ed i relativi gdl, nei disegni complessi a più fattori in cui si analizzano anche le interazioni, sono numerosi. In vari testi di statistica applicata dei decenni scorsi, è riportato anche il metodo dei confronti ortogonali; erano di grande utilità soprattutto in un periodo in cui i calcoli erano svolti manualmente, al massimo con l’aiuto delle calcolatrici da tavolo, per ridurre la probabilità di errori e abbreviare i tempi necessari. Ora, con i risultati ottenuti mediante programmi informatici, per i quali si richiede solo una corretta impostazione dell’input, diventa essenziale comprendere quali concetti sono alla base delle varie analisi, come si devono interpretare gli output e quale è l’esatto significato dei risultati ottenuti. A questo fine, come generalizzazione dei metodi già presentati per due fattori con repliche, è utile considerare due casi semplici: un esperimento fattoriale 2 x 2 ed uno, relativamente più complesso, di 2 modalità per 3 fattori (23).
In un esperimento fattoriale 2 x 2 (cioè 2 modalità x 2 fattori = 4 trattamenti), il fattore A ed il fattore B hanno due sole modalità: assente (a0 e b0) e presente (a1 e b1) oppure dose minima (a1 e b1) e dose massima (a2 e b2); di solito i dati sono riportati in una tabella come quella sottostante
Questo disegno sperimentale non deve essere confuso con quello del test c2 in tabelle 2 x 2, che serve per valutare l’associazione, mediante il confronto di frequenze o conteggi di variabili qualitative o nominali. In questo disegno 2 x 2, entro ogni casella sono riportate non le frequenze ma tante misure quante sono le repliche. Dai confronti tra le 4 medie o i 4 totali (poiché è richiesto un numero di repliche sempre costante), si può stimare la devianza tra trattamenti con 3 gdl; successivamente, è possibile la sua scomposizione in 3 devianze, ognuna con 1 gdl.
ESEMPIO. Con un esperimento di tossicologia sulla crescita di semi, si vogliono valutare gli effetti indipendenti e quelli congiunti di una sostanza (presenza o assenza) e di due diversi livelli di temperatura (20 gradi e 25 gradi). A questo fine sono stati coltivati 4 gruppi di semi, ognuno con 5 unità o repliche, posti in 4 situazioni differenti: - il primo gruppo di semi a temperatura di 20° C e senza la sostanza tossica (a1b1); - il secondo gruppo alla temperatura di 20° C e con la presenza della sostanza tossica (a2b1); - il terzo alla temperatura di 25° C e senza la sostanza (a1b2); - il quarto alla temperatura di 25° C e con la presenza della sostanza (a2b2).
Dopo un mese, sono state misurate le crescite (in mm) di ogni seme:
Valutare se si è manifestato un effetto significativo dei due fattori e se tra loro esiste interazione.
Risposta. Come primo passaggio è utile calcolare le somme
dei 4 gruppi e quella totale. Con esse è possibile stimare: - la devianza totale (102+ 122 + 82 + 122 + + 52 + 72 + 82 + 102) - 1912/20 = 2017 - 1824 = 192,95 che risulta uguale a 192,5 ed ha 19 gdl,
- la devianza tra i 4 trattamenti 512/5 + 342/5 + 692/5 + 372/5 - 1912/5 = 520,2 + 231,2 + 952,2 + 273,8 - 1824,05 = 153,35 che risulta uguale a 153,35 ed ha 3 gdl.
- la devianza d’errore, come somma dei quadrati delle differenze di ogni replica rispetto alla media del suo gruppo o, più rapidamente, per differenza, 192,95 - 153,35 = 39,6 che risulta uguale a 39,6 ed ha 16 (19-3) gdl.
La tabella di sintesi, che riporta anche il valore di F e la sua significatività,
evidenzia che tra i 4 trattamenti esiste una differenza significativa. La sua scomposizione in tre devianze, ognuna con 1 df, è possibile con una metodologia che non si discosta da quella già utilizzata, ma richiama l’approccio dei confronti ortogonali e permette di meglio comprendere sia l’effetto di ognuno dei due fattori che quello della loro interazione. Tale regola di scomposizione della devianza tra trattamenti segue lo schema seguente
dove i gruppi con lo stesso segno devono essere sommati tra loro, per formare due gruppi per ogni confronto.
Per stimare la devianza dovuta al fattore A, tutti i dati devono essere riuniti in due soli gruppi: in uno (-1) quelli che sono indicati con a1 (totale = 51+69 = 120) e nell’altro (+1) quelli con a2 (totale = 34 + 37 = 71). Se fosse vera l’ipotesi nulla (cioè se il fattore A non ha un effetto significativo), le due somme dovrebbero essere uguali (ricordando che tutti i gruppi hanno lo stesso numero di dati). Con la formula abbreviata, tale devianza con 1 df è data da = 1440 + 504,1 - 1824,05 = 120,05 e risulta uguale a 120,05.
Per stimare la devianza dovuta al fattore B, devono essere riuniti in un gruppo (-1) quelli che sono indicati con (totale = 51 + 34 = 85) e nell’altro (+1) quelli con (totale = 69 + 37 = 106). Una differenza tra le due somme che risulti minore (oppure maggiore) della precedente indica che l’effetto del fattore B è minore (oppure maggiore) di quello di A. Per una valutazione corretta della significatività di tali effetti, si calcola la devianza = 722,5 + 1129,6 - 1824,05 = 22,05 che risulta uguale a 22,05 ed ha 1 df.
La devianza dell’interazione A x B è ottenuta mediante il confronto tra la somma dei gruppi (-1) in cui A e B sono assenti o presenti in modo congiunto ( e con totale = 51 + 37 = 88) rispetto a quella dei gruppi (+1) in cui A e B sono presenti separatamente ( e con totale = 34 + 69 = 103). Infatti, se non esistesse interazione e quindi gli effetti di A e B fossero solo additivi, la somma in cui A e B compaiono separatamente dovrebbe essere uguale a quella in cui tali fattori non compaiono o sono presenti contemporaneamente (sempre quando il numero di repliche è uguale in ogni gruppo). La differenza tra le due somme indica anche se l’effetto è di - inibizione, se la somma delle osservazioni in cui non compaiono oppure sono presenti in modo congiunto è minore, - potenziamento, se questa somma è maggiore di quella dei valori in cui i due fattori sono presenti separatamente. Con i dati dell’esempio, la devianza d’interazione è data da = 774,4 + 1060,9 - 1824,05 = 11,25 e risulta uguale a 11,25 con 1 df.
I risultati delle 3 devianze e dei valori di F con la loro significatività possono essere riportati in una tabella conclusiva, che evidenzia come la somma delle 3 devianze (A, B, AB) sia uguale a quella tra trattamenti e ne rappresenti la scomposizione. L‘effetto del fattore A, del fattore B e la loro interazione, utilizzando i dati dell’esempio sono verificati mediante un test F con df 1 e 16, il cui valore critico alla probabilità a = 0.05 è uguale a 4,49 e alla probabilità a = 0.01 è uguale a 8.86. In conclusione sulla crescita dei semi, come risulta nella tabella seguente, - la presenza della sostanza A inibisce la crescita in modo altamente significativo (< 0.001); - la temperatura maggiore favorisce la crescita in modo molto significativo (< 0.01); - l’alta temperatura potenzia l’effetto di riduzione del fattore A in modo significativo (con probabilità leggermente inferiore a 0.05)
Con 2 modalità per 3 fattori (23), è possibile utilizzare lo stesso schema esteso a 8 gruppi. Per un’analisi impostata sulla presenza-assenza di 3 fattori (A, B, C), si richiedono 8 gruppi bilanciati, che possono essere presentati come nell’ANOVA ad un criterio di classificazione
Il modello è
dove - indicano gli effetti principali, - indicano le interazioni di primo ordine od interazioni a due fattori, - indica l’interazione di secondo ordine o interazione a tre fattori, - indica l’errore o residuo di ogni dato o replica.
La devianza totale (che con k repliche ha gdl (8 x k) –1), la devianza tra trattamenti (con gdl 8-1) e la devianza d’errore (con gdl 8 x (k-1)) possono essere calcolati come nell’analisi della varianza ad un criterio. La devianza tra trattamenti ( con 7 gdl) può essere scomposta in - 3 effetti principali, - 3 interazioni di primo ordine, - 1 interazione di secondo ordine mediante una scomposizione ortogonale, rappresentata in uno schema,
dove +1 e -1 indicano i trattamenti che devono essere sommati tra loro, per formare ogni volta i due gruppi che devono essere confrontati. La logica con cui si raggruppano i trattamenti è semplice: - per ognuno dei 3 effetti principali (A, B, C) si sommano tra loro i trattamenti in cui il fattore è assente (-1) e quelli in cui è presente (+1); - per le interazioni di primo ordine (AB, AC, BC) si sommano tra loro i trattamenti in cui è presente un solo fattore (-1) e quelli in cui o sono assenti entrambi o sono entrambi presenti (+1); - per l’interazione di secondo ordine (ABC) si sommano tra loro i trattamenti in cui i tre fattori sono presenti singolarmente o tutti insieme (+1) e tra loro quelli in cui o sono tutti assenti o sono presenti a coppie (-1). Per ognuno dei 7 confronti è possibile calcolare la devianza relativa, con 1 df, che è data da
dove - tot + = totale del gruppo i cui trattamenti sono indicati con + - tot - = totale del gruppo i cui trattamenti sono indicati con - - n+ = numero complessivo delle repliche contenute nel gruppo + - n- = numero complessivo delle repliche contenute nel gruppo - - TOT = somma di tutti i dati - n = numero complessivo di dati o repliche.
ESEMPIO. Per analizzare gli effetti della presenza-assenza di tre sostanze e delle loro interazioni sulla crescita di cavie, sono stati formati 8 gruppi, ognuno di 4 individui. Per un mese, ad ogni gruppo sono state somministrate con il cibo le 3 sostanze a due diversi livelli, secondo lo schema ed i risultati di seguito riportati
in cui le lettere dei trattamenti indicano le sostanze aggiunte nel cibo somministrato e 0 è il controllo. Calcolare la devianza tra gli 8 trattamenti e la sua scomposizione nei 7 confronti ortogonali, al fine di valutare - gli effetti dei 3 fattori, - le loro interazioni di primo ordine e - quella di secondo ordine. Risposta. Ricordando che la somma totale dei 32 dati è uguale a 218, la devianza tra trattamenti è data da
(21,52 + 26,52 + 27,92 + 25,42 + 29,02 + 28,42 + 30,52 + 28,82)/4 - 2182/32 = (462,25 + 702,25 + 778,41 + 645,16 + 841 + 806,56 + 930,25 + 829,44)/4 - 47524/32 = 1498,83 - 1485,125 = 13,705 e risulta uguale a 13,705 con 7 df.
Per la sua scomposizione, è utile costruire la tabella dei confronti ortogonali
con i totali dei due gruppi di trattamenti segnati con + e con -. La devianza del fattore A, con 1 df, riportata come prima nella tabella è data
= 793,83 + 693,01 - 1485,12 = 1,72 e così ogni fattore od interazione fino a quella di secondo ordine (ABC), riportata alla fine della tabella Per una lettura più facile e una visione d’insieme, questi risultati sono riassunti in una tabella
per evidenziare che - la loro somma corrisponde a quella tra trattamenti (a meno delle approssimazioni dei calcoli) e - a differenze maggiori tra i due gruppi (+ e -) corrispondono ovviamente valori di devianza maggiori. Per stimare la significatività occorre naturalmente procedere ai test F, mediante il rapporto di ognuna delle 7 varianze con la varianza d’errore.
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |