IL DISEGNO SPERIMENTALE: CAMPIONAMENTO, PROGRAMMAZIONE DELL’ESPERIMENTO E POTENZA
23.9. IL DISEGNO SPERIMENTALE A QUADRATI LATINI: VANTAGGI, LIMITI E POTENZA
Aumentando i fattori da tenere in considerazione, cresce in modo sensibile anche il numero di dati che è necessario raccogliere. In molti campi della ricerca, è relativamente semplice e poco costoso avere centinaia di dati. Ne consegue che in quei casi sia vantaggioso utilizzare lo schema precedente dei blocchi randomizzati, esteso a più fattori sub-sperimentali. Ma in varie discipline a carattere biologico, medico e ambientale, per il costo e il tempo richiesti da ogni singolo dato, la dimensione complessiva () dell’esperimento diventa il fattore limitante principale. Per essere effettivamente possibile, spesso un esperimento deve utilizzare un campione non superiore a una trentina di dati.
Con tre fattori è vantaggioso ricorrere ai quadrati latini, dei quali viene presentata una tabella 5 x 5
Come appare evidente anche dalla semplice rappresentazione grafica, il quadrato latino è vincolato dal numero di trattamenti. Ognuno dei tre fattori considerati (il fattore sperimentale e due fattori sub-sperimentali) deve avere modalità o livelli e il numero totale di dati è invece di , come sarebbe in uno schema analogo ai blocchi randomizzati.
Già noti in matematica, i quadrati latini (latin squares) sono stati introdotti in statistica da H. W. Norton nel 1939 con l’articolo The 7 x 7 squares (pubblicato su Annals of Eugenics Eugen Vol. 9 pag. 269-307. Tale rivista inizia nel 1925 e pubblica vari articoli importanti nella storia della statistica, tra cui alcuni di R. A. Fisher; termina nel 1954, trasformandosi in Annals of human genetics). Il merito maggiore della diffusione dei quadrati latini nella metodologia statistica, inizialmente limitata alle applicazioni in agraria e successivamente estesa in biologia e in altre discipline, per l’autorevolezza scientifica degli autori è attribuito al volume di R. A. Fisher e F. Yates del 1963 Statistical Tables for Biological, Agricultural, and Medical Research (6th ed. Hafner, New York, 146 p.), che nelle pagine 86-89 riporta varie tabelle. Tra i testi internazionali che presentano questa metodologia sono da citare in particolare quello di G. W. Snedecor e W. G. Cochran del 1980 (Statistical Methods, 7th ed. Iowa State University Press, Ames, Iowa, 507 p.), per la sua grande diffusione internazionale, e quello di C. C. Li del 1964 (Introduction to Experimental Statistics, McGraw Hill, New York, 460 p.), che spiega come calcolare i dati mancanti.
I vantaggi principali dell’uso dei quadrati latini sono - un maggiore controllo della variabilità, rispetto al disegno totalmente randomizzato e a quello a blocchi randomizzati; - la semplicità dell’analisi statistica, leggermente modificata rispetto a quella a blocchi randomizzati; - la facilità con la quale si possono stimare i dati mancanti. Gli svantaggi principali sono - la rigidità dell’esperimento, per cui i tre fattori devono avere sempre lo stesso numero di modalità o livelli, - una applicabilità limitata ai disegni compresi fra le dimensioni 4 x 4 e 12 x 12. Infatti non è possibile effettuare un quadrato latino 2 x 2, poiché la devianza d’errore non ha nessun grado di libertà. Un esperimento con un quadrato 3 x 3 non è conveniente, poiché il test F ha gradi di libertà 2 e 2, ai quali corrisponde un valore critico molto alto. Dall’altro estremo, con più di 12 trattamenti, ma in alcune discipline anche prima, l’esperimento è di realizzazione complessa e richiede una messa in opera molto macchinosa.
Le condizioni di validità sono uguali a quelle dei blocchi randomizzati. Anche nel caso in cui manchino uno o più dati e per la stima dell’efficienza relativa le modalità sono analoghe, come già illustrato nei capitoli dedicati alla presentazione dell’analisi della varianza a due o più fattori.
Per calcolare la potenza a priori e quella a posteriori nel disegno sperimentale a quadrati latini, mediante il metodo grafico occorre stimare il valore di . Con livelli in ognuno dei tre fattori, è determinato dalla relazione
Anche in questo caso, le formule abbreviate per la stima di dipendono dall’ipotesi alternativa H1 sulla differenza tra le medie: 1) se si considera la differenza massima tra una media e tutte le altre, che sono tra loro uguali, si utilizza la formula
2) se si ipotizza che le medie dei trattamenti sono tutte tra loro differenti e si considera la differenza reale esistente tra la media minore e la media maggiore, si utilizza la formula
Nel grafico delle figure di potenza, si deve entrare con i gradi di libertà - = - = , ovviamente quando non si hanno dati mancanti, e con la probabilità a prescelta.
ESEMPIO 1 (CALCOLO DELLA POTENZA). Calcolare la potenza di un’analisi della varianza a quadrati latini in esperimento 5 x 5, per una probabilità prefissata = 0.05 e una differenza reale tra la media minore e quella maggiore dei trattamenti pari a = 2,0
Risposta. Da = 1,41 si ricava = 1,41. Dalle dimensioni dell’esperimento che sono state indicate, i parametri da utilizzare nei grafici delle curve di potenza di Pearson e Hartley (riportate anche alla fine del capitolo) sono = 4; = 12; = 0.05; = 1,41 Nella curva di potenza con = 4 (verificare nella 4 figura, in alto a sinistra), - per = 0.05 (nel gruppo di curve a sinistra), - il valore = 1,41 (riportato nella numerazione superiore sull’asse delle ascisse e che varia da 1 a 3) - incontra la curva per = 12 in un punto che, trasferito orizzontalmente sulla potenza, fornisce approssimativamente il valore = 0,52. Tale risposta significa che con l’esperimento programmato esiste una probabilità del 52%, che il test risulti significativo.
ESEMPIO 2 (CALCOLO DEL NUMERO DI REPLICHE ). Quale dimensione deve avere un esperimento a quadrati latini, se si vuole un test con una potenza = 0,90 mantenendo inalterato = 2,0?
Risposta. Con i parametri = 2,0; = 0.05; = 0,90 e = 1,41 in quanto in questa formula è indipendente dalle dimensioni del quadrato, occorre predeterminare il valore di . Sulla base dell’esperienza, per aumentare la potenza si può assumere un disegno 8 x 8, nel quale = 7; = 42;
Dalla lettura del grafico = 7 - per = 0.05 (nel gruppo di curve a sinistra), - il valore = 1,41 (riportato nella numerazione superiore sull’asse delle ascisse e che varia da 1 a 3) - incontra la potenza = 0,90 in un punto in cui il valore di non è riportato. E’ quindi necessario aumentare ancora le dimensioni. Ma, con questi grafici, la potenza del test è stimabile fino a tabelle di dimensioni 9 x 9 che hanno = 8. Inoltre un aumento delle dimensioni può rendere l’esperimento non realistico in quanto troppo macchinoso.
| |||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |