IL DISEGNO SPERIMENTALE:

CAMPIONAMENTO, PROGRAMMAZIONE DELL’ESPERIMENTO E POTENZA

 

 

23.8. IL DISEGNO SPERIMENTALE A BLOCCHI RANDOMIZZATI: VANTAGGI, LIMITI E POTENZA

 

 

Quando esiste almeno un fattore sub-sperimentale che è causa di un’alta variabilità nelle risposte, come l’età infantile, adulta oppure anziana, tra pazienti ai quali sia stato somministrato lo stesso farmaco, è utile ridurre la variabilità non controllata o varianza d’errore se si vuole aumentare la probabilità che il test di confronto tra medie del fattore sperimentale (i farmaci) risulti significativo.

Riprendendo l’esempio del paragrafo precedente sulla somministrazione di = 5 farmaci a = 20 cavie, disponendo non di materiale omogeneo ma di varie nidiate con caratteristiche genetiche e con età molto differenti, si deve preparare

-  un numero di nidiate che sia uguale al numero di repliche che si intende eseguire (ad es. = 4);

-  ogni nidiata scelta deve avere un numero di individui almeno uguale oppure superiore a quello dei trattamenti (= 5);

- da ogni nidiata si deve estrarre a caso un numero di cavie uguale al numero di trattamenti, assegnando a caso ogni animale a uno dei cinque trattamenti.

 

Per facilitare la comprensione dei risultati; è conveniente riportare i dati in una tabella a due entrate:

 

 

 

TRATTAMENTI

BLOCCHI

A

B

C

D

E

1

2

3

4

 

 

L’analisi della varianza richiede preliminarmente alcune verifiche, che sono già state illustrate in capitoli precedenti:

 

1) Non deve mancare alcun dato. Se uno o più dati sono stati perduti in modo accidentale, è necessaria la loro sostituzione. Occorre

- calcolare il valore dei dati mancanti,

- modificare i gradi di libertà,

- correggere la stima delle varianze.

 

2) Devono essere rispettate le condizioni della normalità della distribuzione e della omogeneità delle varianze. Anche esse possono essere verificate con i test già illustrati. Se si rifiuta l’ipotesi nulla, occorre tentare di costruire le condizioni richieste attraverso la trasformazione dei dati

 

3) Analoga a queste, è la condizione di additività dei fattori. Nel caso di un solo dato per casella come nell’ultima tabella, la presenza di interazione o non additività può essere verificata con il test di Tukey: se è presente interazione o non additività tra i due fattori, si richiede la trasformazione logaritmica dei dati, che appunto rende additivi i fattori che tra loro hanno una relazione di moltiplicazione.

 

Dopo l’analisi della varianza, spesso è utile valutare in modo critico l’esperimento condotto. Anche in questo caso, i metodi sono già stati presentati nei capitoli dedicati all’analisi della varianza. I più importanti sono due.

1)  Determinare per il fattore sperimentale il miglioramento sulla significatività del test F, che deriva dall’aver considerato due o più fattori rispetto a un disegno sperimentale più semplice, mediante il calcolo dell’efficienza relativa (E.R.).

2)  Determinare se nell’esperimento effettuato le variabili sperimentali e sub-sperimentali sono state scelte in modo appropriato oppure se ne sono state trascurate di rilevanti, mediante il valore dell’indice R2.

 

A queste analisi è da aggiungere il calcolo della potenza a priori e a posteriori.  Per il disegno sperimentale a blocchi randomizzati, si utilizzano le stesse formule già illustrate nel paragrafo precedente. Ovviamente, in rapporto al fattore per il quale si verifica l’ipotesi nulla sulle medie.

1)  se si considera la differenza massima tra una media e tutte le altre, che sono tra loro uguali, si utilizza la formula

2)  se le  medie dei trattamenti sono tutte tra loro differenti e si considera la differenza reale esistente tra la media minore e la media maggiore,

si utilizza la formula

Rispetto al disegno completamente randomizzato presentato nel paragrafo precedente, in questo disegno a blocchi randomizzati,

- gradi di libertà della devianza tra restano ,

- mentre i gradi di libertà della devianza d’errore diventano , quando ovviamente non si hanno dati mancanti.

 

ESEMPIO 1  (CALCOLO DELLA POTENZA). Calcolare la potenza di un’analisi della varianza a blocchi randomizzati, con  = 5   e    = 4, per una  probabilità prefissata  = 0.05   e  una differenza reale tra la media minore e quella maggiore dei trattamenti pari a  = 2,0.

 

Risposta.   Da

 =

 si ricava  = 1,26.

Dalle dimensioni dell’esperimento che sono state indicate, cioè un’analisi della varianza a blocchi randomizzati con  = 5   e    = 4 e quindi = 20, i parametri da utilizzare nei grafici delle curve di potenza di Pearson e Hartley (riportate anche alla fine del capitolo) sono

= 4;     = 12;     = 0.05;     = 1,26

 

Nella curva di potenza con = 4 (verificare nella 4 figura, in alto a sinistra),

- per = 0.05 (nel gruppo di curve a sinistra),

- il valore = 1,26 (riportato nella numerazione superiore sull’asse delle ascisse e che varia da 1 a 3)

- incontra la curva per = 12 in un punto che, trasferito orizzontalmente sulla potenza, fornisce approssimativamente il valore  = 0,42.

Tale risposta significa che con l’esperimento programmato esiste una probabilità bassa, più esattamente di circa il 42%, che il test risulti significativo.

 

ESEMPIO 2  (CALCOLO DEL NUMERO  DI REPLICHE ).   Quanti dati  è necessario avere per ogni campione, se si vuole un test con una potenza  = 0,90?

Risposta.  Con i parametri

= 4;     = 2,0;     = 0.05;      = 0,90

 occorre procedere per tentativi, in quanto  è calcolabile solo conoscendo , che si vuole appunto stimare.

Sulla base dell’esperienza, per aumentare la potenza si deve assumere un valore di  sensibilmente maggiore di prima, ad esempio approssimativamente = 50 al posto di = 12.

Poiché i gruppi sono = 5 e nell’esperimento a blocchi randomizzati  = 50, si ricava che  è approssimativamente uguale a 13

 =

 e il valore  risulta uguale a  2,28.

Dalla lettura dello stesso grafico (= 4)

- per = 0.05 (nel gruppo di curve a sinistra),

- il valore = 2,28 (riportato nella numerazione superiore sull’asse delle ascisse e che varia da 1 a 3)

- incontra anche la curva  = 50 in un punto che corrisponde alla potenza  = 0,97-0,98.

Con 13 dati per gruppo, la potenza del test sarebbe sensibilmente maggiore di quella ipotizzata.

 

Se il numero totale di dati (65= 13 x 5) appare accettabile per i costi e/o il tempo richiesti da questa dimensione dell’esperimento è vantaggioso utilizzare questa potenza maggiore di quella minima richiesta.

Se invece si ritiene tale dimensione eccessiva, è possibile ridurla rispettando la potenza  = 0,90 richiesta. Con 9 dati per gruppo (quindi in totale 45 cavie), i gradi di libertà della varianza d’errore diventano = 32 (8 x 4) e

 =

 il valore  = 1,90.

 

Dalla lettura dello stesso grafico (= 4)

- per = 0.05 (nel gruppo di curve a sinistra),

- il valore = 1,90 nel punto in cui  coincide con la retta di potenza  = 0,90 in modo approssimato incontra la curva  = 20 che rappresenta una stima più bassa di quella calcolata in precedenza (= 32)

Con un ulteriore tentativo, nel quale si ipotizza  = 8 e quindi  = 28 (7 x 4)

si ottiene

 =

 il valore  = 1,79.

Il valore = 1,79 incontra la retta di potenza  = 0,90  nel punto in cui incontra anche la curva  = 30 che rappresenta una stima molto vicina a quella ipotizzata, data l’approssimazione di questi metodi grafici.

In conclusione, per rispettare le condizioni poste sono sufficienti 8 dati per gruppo, con un totale complessivo di 40 cavie.

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007