L’ANALISI GERARCHICA E LE COMPONENTI DELLA VARIANZA
14.13. ESEMPIO DI ANALISI DELLA VARIANZA A DUE FATTORI CON INTERAZIONE, IN UN MODELLO A EFFETTI FISSI E UNO A EFFETTI RANDOM, SU GLI STESSI DATI; ESEMPIO DI STIMA DELLE COMPONENTI DELLA DEVIANZA.
Il caso più semplice di esperimento fattoriale prende in considerazione solamente due fattori o trattamenti (A e B), ognuno a più livelli, che possono essere indifferentemente uguali o differenti. L’analisi statistica verifica separatamente gli effetti nei diversi livelli - sia dei due singoli trattamenti (A e B), - sia della loro interazione (A x B).
Agli stessi dati e con metodologie in larga parte identiche, ma per rispondere a domande differenti, è possibile applicare A - sia l’ANOVA I chiamata anche modello a effetti fissi (fixed effects model), B - sia l’ANOVA II chiamata anche modello a effetti random (random effects model) o modello delle componenti di varianza (components of variance model), C - sia l’ANOVA III, dove un fattore è fisso e l’altro è random, chiamata modello misto (mixed model); in caso di più fattori, almeno uno è fisso e almeno uno è randon.
Per analizzare l’interazione tra due variabili, esse devono sempre essere crossed; in un disegno sperimentale nested o gerarchica, in cui una variabile è annidata entro l’altra, non è possibile. I concetti generali dell’analisi a effetti fissi e di quella a effetti random sono già stati presentati nei paragrafi precedenti. In questo, viene riportata una loro applicazione agli stessi dati, - per meglio evidenziare la parte simile e le differenze. L’esempio sviluppato è tratto dal testo di - Douglas C. Montgomery del 1976 Design and Analysis of Experiments (edito da John Wiley & Sons, New York, XIV + 418 p.). Docente di metodi statistici nel Georgia Institute of Technology, Montgomery è autore di vari testi di statica applicata alla ricerca industriale. In questo volume, che ha ormai 30 anni, espone una serie di applicazioni dell’analisi della varianza. Rispetto al testo, il suo esempio è svolto giustificando tutti i passaggi logici.
I concetti della varianza qui discussi stanno alla base di molti metodi statistici industriali, ora utilizzati correntemente per il controllo di qualità. In questi anni, queste applicazioni stanno assumendo importanza crescente anche nelle discipline ambientali e biologiche, quando la gestione dell’ambiente o di un prodotto biologico richiedano confronti sulla variabilità più che sui valori medi.
In queste dispense, in particolare per gli aspetti più complessi, molti esercizi sono tratti da testi internazionali. Con la dovuta citazione, offrono la possibilità di supportare la metodologia scelta in pubblicazioni scientifiche e rapporti anche con l’autorevolezza scientifica dell’autore del testo, in eventuali dibattiti con i referee. Tale motivazione a maggior ragione è valida in questo contesto, dove le differenze tra i metodi dipendono quasi esclusivamente dalla scelta del problema, dalla giustificazione fornita per un confronto a effetti fissi oppure a effetti random, dalla una diversa interpretazione degli stessi dati.
Nell’esempio utilizzato, si intende confrontare il voltaggio massimo di una serie di batterie, tenendo in considerazione - il materiale (fattore A), la temperatura di esercizio (fattore B), - e la eventuale presenza di interazione tra essi. Ognuno dei due fattori è a tre livelli e sono state fatte quattro repliche per ogni condizione sperimentale.
In questo caso, come in vari testi e diversamente dalle altre parti di queste dispense, - il fattore principale (i trattamenti) è riportato nelle righe, - mentre il fattore secondario o da controllare (i blocchi) è riportato nelle colonne:
A – ANOVA I O MODELLO A EFFETTI FISSI Nel caso del
modello ANOVA a due criteri con repliche, per l’analisi degli effetti fissi,
ogni singola osservazione
dove - - - - -
Nell’esempio,
Come in ogni test, è necessario iniziare dall’enunciazione delle finalità.
Nel modello a effetti fissi, le ipotesi da verificare possono essere 1 - per i trattamenti o fattore A H0: 2 - per i blocchi o fattore B H0: 3 - per l’interazione A x B H0:
Abitualmente sono verificate tutte tre. Ma l’analisi può essere limitata a una sola ipotesi, se l’interesse del ricercatore a rivolto a quell’unico problema.
Per effettuare i vari test F, dai dati devono essere calcolate 5 devianze: (1) Totale, (2) Tra Trattamenti, (3) Tra blocchi, (4) Interazione: Trattamenti per Blocchi, (5) Errore.
Utilizzando le formule abbreviate, che in questo caso sono molto più semplici,
1 – La devianza totale ( e con i dati dell’esempio
risulta e ha gdl =
La successiva Devianza tra le medie delle caselle non è richiesta per i test di significatività. Ma essa è utile per - meglio comprendere le formule successive, - arrivare rapidamente al calcolo delle altre devianze. Inoltre le medie di casella servono per evidenziare gli effetti della interazione tra i due fattori (A x B).
Pertanto, dalla
tabella dei dati riportata precedentemente, è opportuno ricavare le medie delle
9 caselle. In realtà le formule abbreviate utilizzano le somme. Ma in
campioni bilanciati (nell'esempio
La devianza tra caselle (
e con i dati dell’esempio
risulta e ha gdl =
Successivamente si calcolano le altre quattro devianze già indicate:
2 - La devianza tra materiali (
con i dati dell’esempio
risulta e ha gdl =
3 - La devianza tra temperature (
con i dati dell’esempio
risulta e ha gdl = 4 - La devianza
d’interazione (
se applicata ai dati dell’esempio
risulta e ha gdl = 8 – 2 – 2 = 4.
5 - La devianza
d’errore (
Con i dati dell’esempio
risulta e ha gdl = 35 – 8 = 27.
(Per calcolare la devianza d’interazione e la devianza d’errore direttamente e non mediante le differenze, si rinvia ai paragrafi nei quali i metodi sono stati illustrati in modo dettagliato). Per verificare i calcoli attraverso le
proprietà additive e per impostare le analisi successive, è conveniente
riportare le devianze (
(I valori riguardanti le medie delle caselle sono stati scritti in corsivo per differenziarle, ricordando che molti programmi informatici abitualmente li omettono).
Dal rapporto tra le
devianze e o rispettivi degree of freedom, si ricavano le varianze
Dalla tabella dei
valori critici, per i gradi di libertà corrispondenti, si ricavano le
probabilità - una significatività alta per i due fattori principali, - la presenza di significatività anche per l’interazione Materiali per Temperature.
Nella interpretazione disciplinare dei risultati statistici, la significatività della interazione (Materiali x Temperatura) indica che - le variazioni di temperatura hanno effetti differenti sui tre materiali. Per una lettura più dettagliata e una spiegazione logica sono di aiuto - la tabella delle medie (Average output voltage) - la loro rappresentazione grafica, in funzione delle temperature (Temperature °F) riportate nella pagina successiva.
L’analisi combinata dei risultati statistici e l'osservazione dei valori medi conduce alle seguenti tre conclusioni: 1 - con probabilità
2 - con probabilità
3 - con probabilità
La tabella e il grafico precedenti mostrano, ad esempio, che per una temperatura di 50°F il materiale di tipo 2 determina il voltaggio più alto, ma che a temperature superiori (65°F e 80°F) il materiale con il voltaggio massimo è quello di tipo 3.
Per analisi più dettagliate delle differenze sia tra le tre medie dei materiali, sia tra le tre medie delle temperature e anche per le nove medie dell’interazione (materiale per temperatura), occorre utilizzare i confronti multipli a priori oppure a posteriori (per approfondimenti di questi concetti si rinvia ai paragrafi relativi).
B – ANOVA II O MODELLO A EFFETTI RANDOM L’analisi precedente può essere contestata. Probabilmente è errata. Sussiste incertezza sulla sua validità, in quanto non sono state fornite tutte le informazioni necessarie per comprendere l’esatta finalità del test, dalla quale dipende la scelta dei tre livelli del fattore A e del fattore B. I tre livelli del fattore A sono esattamente quelli che si vogliono analizzare con il test oppure - il numero di materiali utilizzabili è più alto e quei tre sono stati scelti casualmente? In altri termini, lo scopo specifico dell’esperimento è di - verificare in generale se materiali differenti hanno effetti differenti sul voltaggio massimo? In questo esempio, la stessa domanda può essere estesa anche alle tre temperature utilizzate. Si voleva verificare l’effetto di quelle tre temperature specifiche, oppure se - variando la temperatura entro un intervallo di condizioni ambientali normali (ad esempio, tra 40°F e 90°F), la temperatura ha effetti importanti?
Se la risposta a questa ultima domanda è affermativa, in modo più specifico se la scelta delle tre temperature (50, 65 e 80 °F) è stata casuale e potevano essere utilizzate altre temperature entro l’intervallo prestabilito, certamente l’analisi statistica precedente è errata. Ai dati presentati, è necessario applicare il modello a effetti random.
Questo lungo ragionamento per meglio chiarire le finalità dell’esperimento ha lo scopo di evidenziare che, soprattutto in questo settore della statistica, - occorre esprimere con chiarezza l’ipotesi di lavoro, la domanda alla quale si vuole rispondere. Ma sono risposte che solamente l’esperto che ha condotto l’esperimento può dare. Da questa semplice osservazione deriva la necessità che egli abbia conoscenze statistiche adeguate, per impostare l’esperimento in modo corretto.
Per passare dall’analisi a effetti fissi all’analisi a effetti random, si supponga ora che i tre materiali e le tre temperature di esercizio (50, 65 e 80 °F) siamo stati scelti casualmente entro un intervallo di variazione maggiore, ottenendo gli stessi risultati conseguiti nell’esperimento precedente:
Come per gli
effetti fissi, anche nell’analisi degli effetti random ogni singola
osservazione
con
Ma in questo caso, i quattro parametri
del modello Quindi hanno effetti nulli e presentano variabilità. - - - - dove NID = Normally and Indipendently Distributed
Ne deriva che - la varianza di ogni osservazione è - Rispetto all’ANOVA a effetti fissi, cambiano anche le ipotesi da verificare. Nel modello a effetti random, sono 1 - per i trattamenti o fattore A H0: 2 - per i blocchi o fattore B H0: 3 - per l’interazione A x B H0:
Per verificare queste ipotesi, si utilizzano - le stesse formule dell’ANOVA a effetti fissi - e si ottiene la stessa tabella di risultati, per quanto riguarda - le devianze, i degree freedom, le varianze.
Cambiano i test F per i due effetti principali, ma non quello per l’interazione.
1 - Per la verifica dell’ipotesi H0:
si effettua il test
Con gdl uguali a 2 e 4 risulta
significativo con probabilità
2 - Per la verifica dell’ipotesi H0:
si effettua il test
Con gdl uguali a 2 e 4 non risulta significativo.
3 - Per la verifica della presenza
d’interazione e quindi dell’ipotesi H0: si effettua il solito test
Con gdl uguali a 4 e 27 risulta
significativo con probabilità
L’interpretazione disciplinare dei risultati statistici ottenuti - per l’interazione è che esiste variabilità tra le medie di caselle; quindi, se si analizzano gli effetti dei possibili materiali utilizzabili alle diverse temperature di esercizio, le potenze massime cambiano in modo differente; - per il fattore A è che, tra tutti i materiali possibili, non esiste una differenza significativa, - per il fattore B è che, tra le possibili temperature di esercizio delle batterie, esiste una differenza significativa nel voltaggio massimo.
Nel testo citato (pag. 136), Douglas Montgomery sottolinea che, come nel caso degli effetti fissi, - questi test sono sempre unilaterali o a una coda (These are all upper-tail, one-tail tests), in quanto per risultare significativi - la varianza al numeratore deve essere maggiore di quella al denominatore.
A questo fine, è utile ricordare che le tabelle F per l’ANOVA sono unilaterali. Quindi si utilizza la probabilità a indicata. Il problema, come evidenziato nel capitolo relativo, si pone solamente per - il test bilaterale di omoschedasticità tra due sole varianze, in quanto il test F è fondato sul rapporto tra la varianza maggiore e quella minore senza che a priori sia noto quale delle due sia quella maggiore, quindi decidendo solamente sulla base dell’osservazione dei risultati campionari. Nei test bilaterali di omoschedasticità, - per una probabilità a = 0.05 bilaterale si deve prendere il valore critico di a = 0.025.
Ritornando all’ANOVA II, la spiegazione logica della metodologia illustrata è fondata sui tre concetti seguenti: 1 – La varianza attesa per l’errore
mentre la varianza attesa per
l’interazione A x B quindi per verificare l’ipotesi H0:
il rapporto dove
2 – La varianza attesa per il fattore B
mentre la varianza attesa per
l’interazione A x B quindi per verificare l’ipotesi H0:
il rapporto dove
3 – La varianza attesa per il fattore A
mentre la varianza attesa per
l’interazione A x B quindi per verificare l’ipotesi H0:
il rapporto dove
LE COMPONENTI DELLA VARIANZA E LORO INTERVALLO DI CONFIDENZA Con
è possibile stimare le componenti della varianza (the variance components) - con il metodo dell’analisi della varianza (analysis of variance methods).
Ritornando ai dati dell’ultima tabella ANOVA II,
con il metodo
detto dell’analisi della varianza (analysis of varaince methods),
appunto perché si serve dei risultati riportati nella tabella dell’analisi
della varianza per stimare 1 - da
2 - da
3 - da
4 - da
Il valore Il valore vero poiché
è distribuito come un Per una spiegazione dettagliata delle modalità, si rinvia al paragrafo dedicato all’intervallo di confidenza di una varianza.
Il metodo dell’analisi della varianza, per ricavare la
stima delle componenti della varianza, non richiede l’assunzione della
normalità degli errori, ma solo che
Il metodo di stima dell’intervallo di confidenza della varianza d’errore non sempre può essere utilizzato anche per le altre varianze. Con il metodo dell’analisi della varianza, può infatti avvenire che - una componente della varianza risulti negativa, in quanto è una stima campionaria di un valore che dovrebbe essere uguale a 0. Ma, per definizione essendo fondata sul quadrato di scarti dalla media, una componente della varianza non può essere negativa, per cui si assume che essa sia uguale a 0. E’ un approccio che intuitivamente ha un fascino logico, ma che a sua volta genera difficoltà teoriche nei calcoli successivi, in quanto altera le proprietà statistiche degli altri stimatori che nel loro calcolo utilizzano questa componente. Una soluzione alternativa è ricorrere a metodi di stima delle componenti che sono sempre in un campo non negativo; ma a loro volta originano altre complicazioni, in quanto non sono più fondate sul modello lineare di additività delle componenti. Per approfondimenti su questo settore della statistica, si rinvia al testo di Montgomery qui citato e all’articolo di S. R. Searle del 1971 Topics in Variance Component Estimation, pubblicato su Biometrics, Vol. 27, pp.1-76.
C – ANOVA III O MODELLO MISTO; SOLUZIONE STANDARD E ALTRE PROPOSTE L’esempio analizzato in questo paragrafo si presta anche per una discussione sul modello misto dell’analisi della varianza (mixed model analysis of variance), se si suppone che - il fattore A (Materiali) sia fisso (ad esempio, esistono solamente quei tre materiali per costruire le batterie e si vogliono valutare i loro effetti specifici sul voltaggio massimo), - il fattore B (Temperature) sia random (ad esempio, la temperatura di esercizio delle batterie varia da 40 °F a 90 °F e per l’esperimento le tre utilizzate sono state scelte in modo casuale, per rispondere alla domanda generica che a temperature differenti il voltaggio massimo è differente.) Il modello statistico lineare è con
Secondo le ipotesi espresse in precedenza, nel modello misto l’ipotesi nulla 1 - per i trattamenti o fattore A verte sulle medie; più esattamente è H0: e con i dati dell’esempio viene verificata mediante che ha gdl 2 e 4; non è significativa;
2 - per i blocchi o fattore B è H0: e viene verificata con che ha gdl 2 e 27; è altamente significativa;
(Nota Bene: L'aspetto particolare di questo test F è che per la significatività del fattore B, che è una variabile random, - al denominatore
è utilizzata la varianza d'errore - e non quella
d'interazione La causa è dovuta al fatto che, nella enunciazione delle ipotesi per questo test, l'interazione non è stata ritenuta indipendente dal fattore B.)
3 – per l’interazione A x B è H0: si viene verificata con che ha gdl 2 e 27; è significativa.
Le componenti
della varianza La soluzione (diversa da quella riportata per gli effetti random come nel precedente test F) è
Questo approccio generale può essere utilizzato per stimare le componenti della varianza in qualsiasi modello misto e rappresenta il modello standard. Ma sono state proposte anche numerose soluzioni differenti,
che si diversificano dalla precedente per le assunzioni sulle componenti
random
- - - (annotando che in questo caso l’interazione è indipendente dal fattore B) - le varianze attese sono
Per evidenziare maggiormente la differenza con il modello procedente, osservare che prima - la varianza attesa del fattore B era Nel caso ora in discussione, l’ipotesi nulla - per i blocchi o fattore B è sempre H0: ma viene verificata con che ha gdl 2 e 4; è significativa (P < 0.05) Di norma in questo modello, come in questo caso, il test risulta meno significativo. In termini tecnici, si afferma che è più conservativo (in alcuni testi si dice anche che è meno liberale), rispetto al modello misto standard, poiché - la varianza d’interazione - della varianza d’errore
Con i dati dell’esempio, la componente della varianza per il fattore B, sempre ricorrendo al metodo dell’analisi della varianza, è Questo ultimo modello e il precedente sono entrambi casi speciali del modello misto proposto da H. Scheffé - nel 1956 con l’articolo A “Mixed Model” for the Analysis of Variance (pubblicato su Annals of Mathematical Statistics Vol. 27, pp.: 23-36) Questo modello
assume che ogni singola osservazione
dove -
Per approfondimenti, si rinvia all’articolo di R. R. Hocking del 1973 A discussion of the Two-Way Mixed Model (pubblicato su The American Statistician Vol. 27 No. 4, pp.: 148-152)
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |