L’ANALISI GERARCHICA E LE COMPONENTI DELLA VARIANZA
14.4. DISEGNI CON FATTORI NESTED E FATTORI CROSSED
In un esperimento con molti fattori, può capitare che alcuni siano nested ed altri siano crossed. Tale situazione in alcuni testi è chiamata designs with nested and crossed factor, in altri nested-factorial designs. In essi è possibile l’analisi delle interazioni, ma solo per i fattori i cui livelli incrociano tutti i livelli dell’altro fattore, cioè sono tra loro crossed. Anche in questo caso è necessario utilizzare programmi informatici, per evitare errori che sono sempre frequenti, quando i calcoli richiesti sono molto lunghi. Come schema di riferimento è utilizzato l’esempio riportato da Douglas C. Montgomery nel suo testo del 1976 (Design and Analysis of Experiments, John Wiley & Sons, New York, pp. 418). In esso, non sostanzialmente differente dall’esempio del paragrafo precedente, sono state riportate le formule e i relativi risultati, in modo da favorire ulteriormente, con una dimostrazione completa di tutti i passaggi logici e metodologici, la comprensione di queste tecniche che per alcuni aspetti si differenziano da quelle crossed. Si supponga che, per un esperimento nel campo della chimica ambientale, sia stato programmato - il confronto tra la qualità dell’acqua fornita da 2 acquedotti (A e B), - scegliendo a caso 4 pozzi (I, II, III, IV) e - con 2 misure in ogni pozzo per tre anni consecutivi (1, 2, 3), ottenendo i seguenti dati (con totali relativi):
Il modello lineare o additivo di ANOVA I è
con e dove - , , sono gli effetti principali, - è l’interazione tra tempo e acquedotti (cioè una differente evoluzione dei parametri dei pozzi nel tempo), - è l’interazione tra tempo e pozzi (entro acquedotti). E’ stata omessa, in quanto non può esistere, l’interazione poiché pozzi e acquedotti non sono crossed ma nested; per lo stesso motivo, non può esistere neppure quella a tre fattori .
Con a tempi, b acquedotti, c pozzi, n repliche e i dati riportati nella tabella (T = 1252), - la devianza totale
risulta SQTot = 299,7 con df = 47; - la devianza tra tempi
risulta = 82,79 con df = 2; - la devianza tra acquedotti
risulta = 4,08 con df = 1; - la devianza tra pozzi (entro acquedotti)
risulta = 71,93 con df = 6 ottenuti da 2×(4-1); - la devianza di interazione tempi per acquedotti
risulta = 19,05 con df = 2, corrispondenti ai 6 totali tempi x acquedotti (quindi df=5) ai quali sono stati sottratti 1 df degli acquedotti e 2 df dei tempi - la devianza di interazione tempi per pozzi (entro acquedotti) è
Dopo aver calcolato i totali delle misure che appartengono allo stesso tempo e allo stesso pozzo
si stimano le 4 quantità della somma precedente
Da essi si ottiene la stima della devianza di interazione tempi per pozzi (entro acquedotti)
che risulta = 65,82 con df = 12 determinati da b×(a-1)×(c-1) = 2×(3-1)×(4-1); - la devianza di errore e i suoi df, ricavati mediante la loro proprietà additiva, seguendo il modello del disegno sperimentale applicato
Con i dati dell’esempio, la devianza d’errore = 299,70 - 82,79 - 4,08 - 71,93 –19,05 – 65,82 = 56,03 risulta = 56,03 e i suoi gradi di libertà df = 47 – 2 – 1 – 6 – 2 – 12 = 24 sono df = 24.
Per una visione complessiva e un confronto più rapido, nei tesi e nei programmi informatici i risultati sono riportati in una tabella:
che offre anche il vantaggio di evidenziare le varianze, il risultato di ogni test F e la sua significatività. Nell’analisi nested, soprattutto in un disegno sperimentale abbastanza complesso come questo, occorre porre attenzione a come nei vari test F deve essere scelta la varianza da porre al denominatore, pure seguendo la logica semplice presentata nei paragrafi precedenti.
1- L’ipotesi sulla differenza tra le medie dei tempi come varianza al denominatore deve utilizzare quella derivata dal suo livello inferiore, cioè tempi x pozzi, poiché è quella che misura la variabilità nel tempo; pertanto dal rapporto
si ottiene un valore F = 7,54 che, con df 2 e 12, risulta significativo alla probabilità a < 0.01.
2 - L’ipotesi sulla differenza tra le medie degli acquedotti come varianza al denominatore deve utilizzare quella del suo livello immediatamente inferiore, cioè quella tra pozzi; si ottiene
un F = 0,34 che ha df 1 e 6. E’ un valore minore di 1 e quindi non significativo. Questo valore così basso potrebbe suggerire che forse i pozzi sono stati scelti dai responsabili dell’acquedotto non in modo casuale, ma con lo scopo preciso di compensare le caratteristiche chimiche delle loro acque, in modo tale che le medie dei due acquedotti risultino tra loro simili.
3 - L’ipotesi sulla differenza tra le medie dei pozzi entro acquedotti come varianza al denominatore deve utilizzare quella del suo livello immediatamente inferiore, cioè quella calcolata sulla variabilità delle due analisi per ogni pozzo; si ottiene
un valore F = 5,15 che, con df 6 e 24, risulta significativo alla probabilità a < 0.01.
4 - L’ipotesi sulla esistenza dell’interazione tempi x acquedotti, cioè di medie annuali dei due acquedotti che hanno una evoluzione differente nel tempo, come varianza ad denominatore deve utilizzare quella derivata dal suo livello immediatamente inferiore, cioè tempi x pozzi; si ottiene
un valore F = 1,74 che, con df 2 e 12, non è significativo.
5 - L’ipotesi sulla interazione tempi x pozzi (entro acquedotti), utile per valutare se le medie annuali dei quattro pozzi hanno una evoluzione differente nel tempo tra i due acquedotti, come varianza al denominatore deve utilizzare quella del suo livello inferiore, cioè quella d’errore derivata dalla variabilità entro ogni pozzo; si ottiene
un valore F = 2,36 che, con df 12 e 24, risulta significativo alla probabilità a < 0.05.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |