IL DISEGNO SPERIMENTALE:

CAMPIONAMENTO, PROGRAMMAZIONE DELL’ESPERIMENTO E POTENZA

 

 

23.9.  IL DISEGNO SPERIMENTALE A QUADRATI LATINI: VANTAGGI, LIMITI E POTENZA

 

 

Aumentando i fattori da tenere in considerazione, cresce in modo sensibile anche il numero di dati che è necessario raccogliere. In molti campi della ricerca, è relativamente semplice e poco costoso avere centinaia di dati. Ne consegue che in quei casi sia vantaggioso utilizzare lo schema precedente dei blocchi randomizzati, esteso a più fattori sub-sperimentali. Ma in varie discipline a carattere biologico, medico e ambientale, per il costo e il tempo richiesti da ogni singolo dato, la dimensione complessiva () dell’esperimento diventa il fattore limitante principale. Per essere effettivamente possibile, spesso un esperimento deve utilizzare un campione non  superiore a una trentina di dati.

 

Con tre fattori è vantaggioso ricorrere ai quadrati latini, dei quali viene presentata una tabella 5 x 5

 

 

TIPO DI TRATTAMENTO DEL TERRENO

CONCIME

I

II

III

IV

V

1

A

C

B

D

E

2

E

B

C

A

D

3

C

A

D

E

B

4

B

D

E

C

A

5

D

E

A

B

C

 


Come appare evidente anche dalla semplice rappresentazione grafica, il quadrato latino è vincolato dal numero  di trattamenti. Ognuno dei tre fattori considerati (il fattore sperimentale e due fattori sub-sperimentali) deve avere  modalità o livelli e il numero totale di dati è  invece di , come sarebbe in uno schema analogo ai blocchi randomizzati.

 

Già noti in matematica, i quadrati latini (latin squares) sono stati introdotti in statistica da H. W. Norton nel 1939 con l’articolo The 7 x 7 squares (pubblicato su Annals of Eugenics Eugen Vol. 9 pag. 269-307. Tale rivista inizia nel 1925 e pubblica vari articoli importanti nella storia della statistica, tra cui alcuni di R. A. Fisher; termina nel 1954, trasformandosi in Annals of human genetics). Il merito maggiore della diffusione dei quadrati latini nella metodologia statistica, inizialmente limitata alle applicazioni in agraria e successivamente estesa in biologia e in altre discipline, per l’autorevolezza scientifica degli autori è attribuito al volume di R. A. Fisher e F. Yates del 1963 Statistical Tables for Biological, Agricultural, and Medical Research (6th ed. Hafner, New York, 146 p.), che nelle pagine 86-89 riporta varie tabelle. Tra i testi internazionali che presentano questa metodologia sono da citare in particolare quello di G. W. Snedecor e W. G. Cochran del 1980 (Statistical Methods, 7th  ed. Iowa State University Press, Ames, Iowa, 507 p.), per la sua grande diffusione internazionale, e quello di C. C. Li del 1964 (Introduction to Experimental Statistics, McGraw Hill, New York, 460 p.), che spiega come calcolare i dati mancanti.

 

I vantaggi principali dell’uso dei quadrati latini sono

-  un maggiore controllo della variabilità, rispetto al disegno totalmente randomizzato e a quello a blocchi randomizzati;

-  la semplicità dell’analisi statistica, leggermente modificata rispetto a quella a blocchi randomizzati;

-  la facilità con la quale si possono stimare i dati mancanti.

Gli svantaggi principali sono

-  la rigidità dell’esperimento, per cui i tre fattori devono avere sempre lo stesso numero di modalità o livelli,

-  una applicabilità limitata ai disegni compresi fra le dimensioni 4 x 4  e 12 x 12.

Infatti non è possibile effettuare un quadrato latino 2 x 2, poiché la devianza d’errore non ha nessun grado di libertà. Un esperimento con un quadrato 3 x 3 non è conveniente, poiché il test F ha gradi di libertà 2 e 2, ai quali corrisponde un valore critico molto alto. Dall’altro estremo, con più di 12 trattamenti, ma in alcune discipline anche prima, l’esperimento è di realizzazione complessa e richiede una messa in opera molto macchinosa.

 

Le condizioni di validità sono uguali a quelle dei blocchi randomizzati. Anche nel caso in cui manchino uno o più dati e per la stima dell’efficienza relativa le modalità sono analoghe, come già illustrato nei capitoli dedicati alla presentazione dell’analisi della varianza a due o più fattori.

 

Per calcolare la potenza a priori e quella a posteriori nel disegno sperimentale a quadrati latini, mediante il metodo grafico occorre stimare il valore di . Con  livelli in ognuno dei tre fattori, è determinato dalla relazione

 

Anche in questo caso, le formule abbreviate per la stima di  dipendono dall’ipotesi alternativa H1 sulla differenza tra le medie:

1)  se si considera la differenza massima tra una media e tutte le altre, che sono tra loro uguali, si utilizza la formula

 

2) se si ipotizza che le  medie dei trattamenti sono tutte tra loro differenti e si considera la differenza reale esistente tra la media minore e la media maggiore,

si utilizza la formula

Nel grafico delle figure di potenza, si deve entrare con i gradi di libertà

 =

 = ,  ovviamente quando non si hanno dati mancanti,

 e con la probabilità a prescelta.

 

ESEMPIO 1  (CALCOLO DELLA POTENZA). Calcolare la potenza di un’analisi della varianza a quadrati latini in esperimento 5 x 5, per una  probabilità prefissata  = 0.05   e  una differenza reale tra la media minore e quella maggiore dei trattamenti pari a  = 2,0

 

Risposta.   Da

 = 1,41

 si ricava  = 1,41.

Dalle dimensioni dell’esperimento che sono state indicate, i parametri da utilizzare nei grafici delle curve di potenza di Pearson e Hartley (riportate anche alla fine del capitolo) sono

= 4;     = 12;     = 0.05;     = 1,41

Nella curva di potenza con = 4 (verificare nella 4 figura, in alto a sinistra),

- per = 0.05 (nel gruppo di curve a sinistra),

- il valore = 1,41 (riportato nella numerazione superiore sull’asse delle ascisse e che varia da 1 a 3)

- incontra la curva per = 12 in un punto che, trasferito orizzontalmente sulla potenza, fornisce approssimativamente il valore  = 0,52.

Tale risposta significa che con l’esperimento programmato esiste una probabilità del 52%, che il test risulti significativo.

 

 

ESEMPIO 2  (CALCOLO DEL NUMERO  DI REPLICHE ).   Quale dimensione deve avere un esperimento a quadrati latini, se si vuole un test con una potenza  = 0,90 mantenendo inalterato  = 2,0?

 

Risposta.  Con i parametri

= 2,0;     = 0.05;      = 0,90

 e  = 1,41 in quanto in questa formula è indipendente dalle dimensioni del quadrato, occorre predeterminare il valore di .

Sulla base dell’esperienza, per aumentare la potenza si può assumere un disegno 8 x 8, nel quale

= 7;     = 42;

 

Dalla lettura del grafico = 7

- per = 0.05 (nel gruppo di curve a sinistra),

- il valore = 1,41 (riportato nella numerazione superiore sull’asse delle ascisse e che varia da 1 a 3)

- incontra la potenza  = 0,90 in un punto in cui il valore di   non è riportato.

E’ quindi necessario aumentare ancora le dimensioni. Ma, con questi grafici, la potenza del test è stimabile fino a tabelle di dimensioni 9 x 9 che hanno = 8. Inoltre un aumento delle dimensioni può rendere l’esperimento non realistico in quanto troppo macchinoso.

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007