analisi della varianza (ANOVA  I)

a un CRITERIO di classificazione

E CONFRONTI TRA PIU’ MEDIE

 

 

10.6.   CONFRONTI POST-HOC TRA VARIANZE

 

 

Rifiutata l’ipotesi nulla sull’uguaglianza di k varianze

H0:

 con uno dei test gią illustrati (Hartley, Cochran, Bartlett, Levene), si pone il problema di verificare tra quali la differenza sia significativa. Anche in questo caso, i metodi post-hoc determinano risultati non coincidenti con l’analisi complessiva permessa dai test precedenti; di conseguenza, per il principio di cautela pił volte ricordato, anche per le varianze č utile passare ai confronti multipli solamente dopo aver rifiutato l’ipotesi nulla. Con il test di Bartlett e quello di Levene sono possibili i confronti a priori, mediante la scomposizione dei gradi di libertą, nel rispetto delle condizioni di ortogonalitą tra i vari contrasti. Sono quindi pił potenti di questi test a posteriori, che tuttavia sono utili per ricercare le differenze significative, quando non si disponga di informazioni per organizzare raggruppamenti logici dei campioni raccolti.

Per i confronti post-hoc, tra le varie procedure rintracciabili in letteratura, le proposte di K. J. Levy pubblicate nel 1975 in tre articoli (il primo An empirical comparison of several multiple range tests for variances, su Journal of the American Statistical Association Vol. 70, pp. 180-183; il secondo Some multiple range tests for variances, su Educational and Psychological Measurement vol. 35, pp. 599-604; il terzo Comparing variances of several treatments with a control sullo stesso volume Educational and Psychological Measurement vol. 35, pp. 793-796) offrono il vantaggio di

-  seguire le metodologie di Tukey, Neuman-Keuls e Dunnett, appena illustrate per le medie, 

-  dopo trasformazione in logaritmo naturale (ln) dei valori campionari .

Come per il confronto tra varianze, č condizione essenziale di validitą che i dati di ogni gruppo siano distribuiti in modo normale o molto simile alla normale. Se tale condizione non č rispettata, si richiede la trasformazione o il ricorso a test non parametrici. Resta due problemi

-  con pochi dati, il non rifiuto dell’ipotesi nulla non dimostra che essa sia falsa;

-  con molti dati, č possibile rifiutare l’ipotesi nulla, anche quando la differenza reale e minima.

Ritorna il problema, pił volte dibattuto, della conferma dei risultati ottenuti con i test parametrici attraverso il confronto con i risultati dei test non parametrici equivalenti.

Con un test analogo al q di Tukey e l’uso della stessa tabella dei valori critici, č possibile valutare la significativitą della differenza tra due varianze generiche (  e  )

 mediante la formula generale

 dove

-  oltre la consueta simbologia del test di Tukey per a  e  k,

n sono i gdl del contrasto, (n =  n1 + n2)

Nel caso di un contrasto tra due campioni bilanciati,

 la formula diventa

 

Per eseguire i calcoli con il logaritmo in base 10 (log10), la differenza da riportare al numeratore č ottenuta dalla relazione

 

Come applicazione del test di Tukey, si supponga di voler confrontare alla probabilitą experimentwise aT = 0.05 le quattro varianze campionarie riportate nella tabella

 

 

Gruppo

A

B

C

D

2,69

2,86

2,09

5,92

60

25

42

38

0,9895

1,0508

0,7372

1,7783

 

 

con il relativo numero di dati e la trasformazione in logaritmo naturale.

Per facilitare l’ordine dei confronti, č conveniente disporre le medie per rango

 

 

Rango

1

2

3

4

0,7372

0,9895

1,0508

1,7783

Gruppo

C

A

B

D

 

 

 ricordando che con k = 4 i contrasti semplici sono  = 6.

Con la procedura stepwise si inizia dalla differenza massima, cioč dal confronto tra i due valori estremi e si procede verso l’interno.

 

1) Il primo confronto č tra rango 1 e rango 4 (gruppo C  versus  gruppo D) e

 

 

 determina un valore  q = -4,59

 mentre quello critico (vedi tabella Q) per a = 0.05    k = 4    n = 60 (valore approssimato per difetto come somma dei gdl delle due varianze del contrasto) č 3,737.

Poiché quello calcolato (-4,59) in valore assoluto č maggiore di quello critico (3,737), si rifiuta l’ipotesi nulla. Si procede al confronto successivo

 

2) Il secondo confronto č tra rango 2 e rango 4 (gruppo A  versus  gruppo D) e

 

 

 determina un valore  q = -3,75

 mentre quello critico (vedi tabella Q) per a = 0.05    k = 4    n = 60 (valore approssimato per difetto come somma dei gdl delle due varianze del contrasto) č 3,737.

Poiché quello calcolato (-3,75) in valore assoluto č maggiore di quello critico (3,737), si rifiuta l’ipotesi nulla. Anche in questo caso si deve procedere al confronto successivo.

 

3) Il terzo confronto č tra rango 3 e rango 4 (gruppo B  versus  gruppo D) e

 determina un valore  q = -2,78

 mentre quello critico (vedi tabella Q) per a = 0.05    k = 4    n = 60 (valore approssimato per difetto come somma dei gdl delle due varianze del contrasto) č 3,737.

Poiché quello calcolato (-2,78) in valore assoluto č minore di quello critico (3,737), non si puņ rifiutare l’ipotesi nulla. Con questo risultato ha termine il confronto tra varianze.

 

Infatti, per l’ordine con il quale sono verificati, gli altri tre contrasti

-  il confronto tra rango 1 e rango 3 (gruppo C versus gruppo B)

-  il confronto tra rango 2 e rango 3 (gruppo A versus gruppo B)

-  il confronto tra rango 1 e rango 2 (gruppo C versus gruppo A)

 determinano differenze minori e quindi saranno ancor meno significative.

 

Per ottenere un confronto sintetico e di lettura pił agevole, i risultati possono essere riportati in una tabella, che evidenzia le significativitą di ogni contrasto

 

Contrasto

Gruppi

D (val ass)

Q stimato

Q critico

Conclusione

1  vs  4

C  vs  D

1,0411

4,59

3,737

Significativo

2  vs  4

A  vs  D

0,7888

3,75

3,737

Significativo

3  vs  4

B  vs  D

0,7275

2,78

3,737

Non signific.

1  vs  3

C  vs  B

0,3136

---

3,737

Non signific.

2  vs  3

A  vs  B

0,0616

---

3,737

Non signific.

1  vs  2

C  vs  A

0,2523

---

3,737

Non signific.

 

Questi risultati possono essere presentati in vari altri modi (descritti per le medie). Quello grafico

C         A        B        D

 ha il pregio di essere estremamente sintetico e chiaro.

 

La procedura analoga al test SNK richiede la stessa serie di calcoli. Si differenzia dalla precedente per la scelta dei valori critici, che dipendono dal numero di passi che separano le due varianze a confronto, nella serie ordinata per dimensioni.

Per gli stessi sei confronti precedenti, i valori critici corrispondenti con n = 60 sono

 

Contrasto

Q stimato

Q per aT = 0.05

Q per aT = 0.01

Q per aT = 0.001

1  vs  4

4,59

3,737

4,595

5,653

2  vs  4

3,75

3,399

4,282

5,365

3  vs  4

2,78

2,829

3,762

4,894

1  vs  3

---

3,399

4,282

5,365

2  vs  3

---

2,829

3,762

4,894

1  vs  2

---

2,829

3,762

4,894

 

Alla stessa probabilitą aT = 0.05 i valori critici del test SNK sono minori, quando il numero di passi diminuisce. Tuttavia, in questo caso specifico a motivo delle differenze tra le varianze a confronto, per la stessa probabilitą del test precedente si giunge alle medesime conclusioni: i primi due q stimati sono inferiori a quelli critici, mentre il terzo č minore.

Invece per le probabilitą aT = 0.01 e  aT = 0.001, come mostra la tabella, nessun contrasto sarebbe risultato significativo.

 

Per un test analogo a quello di Dunnett secondo la proposta di Levy,

6              se i campioni hanno un numero (ni) differente di osservazioni

 si utilizza la formula generale

 

7              se i campioni sono bilanciati

 si puņ ricorrere alla formula abbreviata

 

 

 

Come applicazione di questo metodo, si supponga che il gruppo D sia quello di controllo

 

Gruppo

D

A

B

C

5,92

2,69

2,86

2,09

38

60

25

42

1,7783

0,9895

1,0508

0,7372

 

 e che si intenda verificare, con un test unilaterale, che le altre tre varianze (A, B, C) siano significativamente minori alle diverse probabilitą  aT = 0.05,  aT = 0.01.

 

1) Il confronto della varianza del gruppo D con quella del gruppo A

 

 

 determina un valore di q uguale a 2,66.

 

2) Il confronto della varianza del gruppo D con quella del gruppo B

 

 

 determina un valore di q uguale a 1,96.

 

3) Il confronto della varianza del gruppo D con quella del gruppo C

 

 

 determina un valore di q uguale a 3,28.


 

Per l’interpretazione č utile riportare i valori calcolati con i valori critici alla probabilitą prefissata:

 

Contrasto

Q stimato

Q per aT = 0.05

Q per aT = 0.01

D  vs  A

2,66

2,10

2,78

D  vs  B

1,96

2,10

2,78

D  vs  C

3,28

2,10

2,78

 

 

Dalla sua lettura emerge con facilitą che

-  alla probabilitą 0.05 unilaterale, la varianza D č significativamente maggiore sia della A che della C;

-  alla probabilitą 0.01 unilaterale, la varianza del gruppo D č maggiore solo di quella del gruppo C.

 

 

  

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Universitą di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007