ANALISI DELLA VARIANZA a piu’ criteri di classificazione
11.6. EFFICIENZA RELATIVA: E.R.
Per una più precisa e completa conoscenza dell’influenza dei vari fattori, l’analisi della varianza a blocchi randomizzati e quella a più criteri di classificazione sono indubbiamente più vantaggiose di quella a un solo criterio. Lo scopo principale di un disegno sperimentale a più criteri è rendere più significativo il test F per i trattamenti, la variabile ritenuta più importante, mediante il controllo delle altre fonti di variazione e la riduzione della varianza d'errore. Tuttavia, non sempre con i disegni a più criteri si ottiene un risultato più significativo, per le differenze tra le medie dei trattamenti. Rispetto all'analisi ad un criterio di classificazione, in una analisi della varianza a blocchi randomizzati o a quadrati latini si ha sempre una riduzione - sia della devianza d'errore - sia dei suoi gradi di libertà. Ma la varianza d'errore, determinata dal loro rapporto, non sempre diminuisce; ovviamente, se la devianza d'errore diminuisce meno dei suoi gdl, la varianza aumenta. Inoltre occorre considerare che, al vantaggio derivante dall'eventuale abbassamento della varianza d'errore, si associa sempre lo svantaggio dovuto alla riduzione dei suoi gradi di libertà; di conseguenza, il valore di F richiesto per dimostrare la significatività del test aumenta. Soprattutto quando i gradi di libertà sono pochi, lo svantaggio derivante dal calo dei gdl della varianza d'errore può essere grave. Per esempio, riprendendo dati precedenti, il valore critico di F alla probabilità a = 0.05 - per gdl 4 e 12 è F = 3,26 - mentre per gdl 4 e 2 è F = 19,25. Di conseguenza, per il solo effetto della riduzione dei gdl, si richiede che la varianza d'errore diminuisca di circa 6 volte, per determinare un F ugualmente significativo.
La convenienza di impiegare un disegno complesso, a più fattori, oppure uno più semplice può essere valutata solo a posteriori, mediante un confronto dei diversi risultati ottenuti nei vari test di significatività. In un precedente esempio di questo capitolo l'analisi della varianza a blocchi randomizzati ha fornito il seguente risultato:
Con i medesimi dati, è sempre possibile condurre un'analisi della varianza ad un solo criterio, calcolando solamente la devianza tra giorni; di conseguenza, - la devianza tra ore ed i suoi gdl devono essere cumulati con quelli d'errore, con il seguente risultato:
Nel caso riportato nella prima tabella, per verificare la differenza tra giorni si ottiene un test
che risulta = 176,36. Con gdl 1 e 3, risulta altamente significativo, poiché il valore critico - alla probabilità a = 0.05 è uguale a 10,13 - alla probabilità a = 0.01 è uguale a 34,12.
Nel caso della seconda tabella, la differenza tra giorni è verificata con test
che risulta F1,6 = 4,035 Con gdl 1 e 6 non è significativo, poiché il suo valore critico - alla probabilità a = 0.05 è uguale a 5,99. La causa di questi risultati differenti a partire dagli stessi dati è dovuta alla differenza tra ore, che è molto alta, come dimostra la sua varianza rispetto a quella d’errore. Anche se l’analisi intende saggiare solo le differenze tra giorni, in questo caso è conveniente eliminare l’effetto dovuto alla variabilità tra ore, nonostante il dimezzamento dei gdl nell’errore.
Tale convenienza a utilizzare lo schema a 2 criteri rispetto a quello ad 1 solo criterio può essere misurata in modo oggettivo, traducendo i concetti e le valutazioni precedenti in una misura. E’ l’efficienza relativa (relative efficiency chiamata in italiano anche efficacia relativa e simboleggiato con E.R.) che misura l’efficacia di un disegno sperimentale rispetto ad un altro. Secondo la formula proposta di Fisher essa è data da E. R. =
che, in modo più conveniente per i calcoli, in molti testi è scritta come
E. R. dove - n1 = numero di gdl della varianza d'errore nell'analisi con il 1° metodo, - n2 = numero di gdl della varianza d'errore nell'analisi con il 2° metodo, - = varianza d'errore nell'analisi con il 1° metodo, - = varianza d'errore nell'analisi con il 2° metodo.
Con i dati sopra riportati, l'efficienza relativa del disegno a due criteri rispetto a quello ad un solo criterio è
uguale a 30,77. E’ una differenza molto grande, come evidenzia la differenza tra le due varianze d’errore. Per effetto della grande variabilità tra ore, l'esperimento a due criteri di classificazione risulta quasi 31 volte più efficace di quello ad un solo criterio. Il significato di tale rapporto è che per ottenere la stessa potenza del test a blocchi randomizzati, con il test a disegno completamente randomizzato occorrono quasi 31 volte più dati: non le 8 osservazioni usate ma addirittura 248.
Sulla base degli stessi principi e con lo stesso metodo, è possibile calcolare l'efficienza di un quadrato latino sia rispetto al disegno a due criteri che a quello ad un solo criterio. In un esempio precedente sui quadrati latini, l'analisi della varianza aveva fornito i seguenti risultati:
Con gli stessi dati, sarebbe stato possibile ignorare la differenza tra arature; la sua devianza e i suoi gdl sarebbero stati sommati a quelli d’errore e i risultati dell'analisi della varianza sarebbero diventati:
Con questi nuovi dati sarebbe stato possibile stimare i due F, relativi - alle differenze tra le medie delle sementi
- alle differenze tra le medie dei concimi
che risultano più significative delle precedenti, - sia a causa della riduzione della varianza d'errore - sia per l’aumento dei gradi di libertà che abbassa il livello del valore critico. Infatti, passando da gdl 4 e 12 a gdl 4 e 16 il valore di F - alla probabilità a = 0.05 diminuisce da 3,26 a 3,01 - alla probabilità a = 0.01 diminuisce da 5,41 a 4,77. Ne deriva che, dopo aver verificato con un quadrato latino che non esiste una differenza significativa tra arature, per dimostrare la significatività delle differenze tra sementi e tra concimi è pertanto più opportuno presentare i risultati secondo lo schema a blocchi randomizzati, anche se l'esperimento è stato effettivamente condotto secondo il precedente schema più complesso.
L'ulteriore possibile riduzione allo schema con un solo criterio di classificazione comporta la scelta del fattore principale. Continuando sempre con il medesimo esempio, come fattore principale potrebbe essere scelto sia il tipo di semente che il concime utilizzato. Nel caso in cui si scegliesse di analizzare solamente le differenze tra i tipi di semente, la nuova analisi della varianza diventerebbe
mentre nel caso in cui si scegliesse le differenze tra concimi si avrebbe
Nel primo caso, il test F con gdl 4 e 20
darebbe un valore di 7,38 e nel secondo caso
sempre per gdl 4 e 20 si otterrebbe un valore di F uguale a 1,47. Le differenze tra sementi rimangono ancora significative, ma con un valore di F notevolmente minore; le differenze tra i concimi non risultano più significative, poiché nella varianza d'errore è stata cumulata anche la grande variabilità che esiste tra le medie delle varie specie di sementi a confronto. Per queste due analisi risulta più conveniente utilizzare il precedente disegno a due criteri, anche se l'interesse è rivolto solamente ad uno dei due fattori isolati.
L'efficienza relativa di uno specifico esperimento a quadrati latini rispetto al corrispondente disegno a blocchi randomizzati o ad un solo criterio di classificazione può essere stimata con la stessa formula usata precedentemente. Per verificare la significatività delle differenze tra le medie delle sementi, l’efficienza relativa del disegno a quadrati latini rispetto a quello a due criteri, in cui non si considera l’effetto delle arature, E. R. = = 0,92 è E. R. = 0,92. Si deve concludere che più conveniente fare un’analisi a due soli criteri che non considerandoli contemporaneamente tutti tre.
Sempre per saggiare la significatività delle differenze tra le medie delle sementi, l’efficienza relativa del disegno a quadrati latini rispetto a quello ad un solo criterio E. R. = = 1,65 è E. R. = 1,65. Per il fattore sementi, con i dati raccolti il disegno a quadrati latini è più efficiente di quello ad un solo criterio. Per ottenere un test con la stessa potenza, nel disegno sperimentale ad un solo criterio servono 1,65 volte i dati utilizzati nell’esperimento a quadrati latini.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |