METODI NON PARAMETRICI PER DUE CAMPIONI INDIPENDENTI

 

 

 

 

9.13.   TEST  DI  SIEGEL-TUKEY  PER  L’UGUAGLIANZA DELLA VARIANZA; CENNI DEL TEST DI FREUND-ANSARI-BRADLEY  E  DEL TEST DI CONOVER

 

 

Nella ricerca ambientale, spesso l'attenzione del ricercatore non è rivolta alla tendenza centrale, ma alla dispersione o variabilità dei dati di due serie indipendenti d'osservazioni.

Nel confronto tra le caratteristiche fisiche o comportamentali di due gruppi d'animali, è atteso che quelli geneticamente identici presentino una minore variabilità del gruppo geneticamente eterogeneo. La variabilità di un campione di animali o vegetali tratto da un ambiente in condizioni normali è spesso inferiore a quella di un campione tratto da un ambiente sotto stress, dove alcuni individui subiscono limiti alla crescita con intensità differente.

Anche la differenza nella variabilità è un indice dell’appartenenza a popolazioni differenti.

 

Nelle analisi di laboratorio, quando si confrontano due reagenti per valutare la qualità del prodotto, la scelta deve essere basata non sulle differenze nel valore medio, che dipende dalla concentrazione della sostanza analizzata, ma sulle differenze della varianza, calcolata su misure ripetute dello stesso campione. Sarà migliore il reagente che fornisce una variabilità minore; sarà più preciso, perché meno influenzato nelle sue risposte da fattori di perturbazione.

 

Se le due variabili casuali X1 e X2 sono distribuite normalmente, la verifica sulla variabilità coincide con quella effettuata con il test F di Fisher-Snedecor.

In campo non parametrico, le proposte sono state numerose. Tra i test più diffusi, sono da ricordare

-          il test di Siegel-Tukey del 1960 (proposto con l’articolo  A nonparametric sum ranks procedure for relative spread in unpaired samples pubblicato su J. Amer. Statist. Ass. vol. 55, pp. 429-445),

-          il test di Freund-Ansari-Bradley divulgato con un articolo del 1957 (J. E. Freund, A. R. Ansari, Two-way rank-sum test for variances, pubblicato su Technical Report, n. 34, Department of Statistics, Virginia Polytechnic Institute) ed uno successivo del 1960 (A. R. Ansari, R. A. Bradley, Rank-sum test for dispersion, pubblicato su Ann. Math. Statist., vol. 31, pp. 1174-1189),

-          il test di Conover del 1980 (presentato da W. J. Conover nel volume Practical Nonparametric Statistics, 2nd edition New York, John Wiley & Sons).

Sono utili nel caso di campioni piccoli, ma richiedono la conoscenza della tendenza centrale (la mediana) dei due campioni o almeno della differenza tra essi.

 

Non è vincolato a questo limite, non richiedendo la conoscenza delle  due mediane, il test di Moses, che sarà presentato successivamente; ma esso ha una potenza inferiore a questi tre, nel caso di campioni con poche osservazioni; quando le osservazioni sono limitate a poche unità, addirittura non può essere applicato.

 

Il test di Siegel-Tukey e il test di Freund-Ansari-Bradley si fondano su concetti simili. Tuttavia, mentre il primo per la significatività utilizza il test U di Mann-Whitney, del quale è relativamente facile avere la tabella dei valori critici, il test di Freund-Ansari-Bradley richiede tabelle specifiche non facilmente reperibili. Viene quindi presentato, in modo dettagliato ed operativo per calcoli manuali, il test di Siegel-Tukey; per il test di Freund-Ansari-Bradley e il test di Conover vengono illustrati solo i concetti di base, utili per capire i risultati di eventuali programmi informatici.

 

Il test di Siegel-Tukey si fonda su concetti e procedure semplici. L’idea di base è che se due campioni, estratti dalla stessa popolazione, hanno varianze diverse, quello con la varianza maggiore avrà una dispersione maggiore dei dati. Se i due gruppi hanno tendenze centrali diverse, è necessario ricondurli alla stesso valore, attraverso l’eliminazione della differenza tra le mediane.

 

Disponendo di due serie di dati, già ordinate in modo crescente,


 

Gruppo A

176

201

225

230

232

269

276

291

---

---

---

---

Gruppo B

44

102

124

142

157

172

194

218

225

232

264

271

 

 di cui il gruppo A con 8 osservazioni ed il gruppo B con 12 osservazioni,

 si supponga di voler verificare se hanno variabilità simile oppure significativamente differente.

 

La procedura richiede vari passaggi.

 

1 – Dopo aver ordinato i dati in modo crescente entro ogni gruppo (già fatto nella tabella di presentazione dei dati),  calcolare le mediane rispettive.

 

Nel gruppo A, composto da 8 dati, essa si colloca tra il 4° valore (230) e il 5°(232) e quindi è uguale a 231:

Gruppo A

176

201

225

230

232

269

276

291

Ranghi

1

2

3

4

5

6

7

8

 

 

Nel gruppo B, composto da 12 valori, si colloca tra il 6°(172) e il 7° (194) e quindi, calcolata come media di questi due valori, risulta uguale a 183:

 

Gruppo B

44

102

124

142

157

172

194

218

225

232

264

271

Ranghi

1

2

3

4

5

6

7

8

9

10

11

12

 

Le due distribuzioni non hanno la stessa mediana; tra esse esiste  una differenza

231 – 183  =  48

 uguale a 48.

 

2 - Occorre ricondurre le due serie di dati ad una situazione in cui abbiano la stessa mediana.

In questo caso, il metodo più semplice è togliere 48 agli 8 valori del gruppo A.

 

Gruppo A

128

153

177

182

184

221

228

243

 

Di conseguenza, la nuova serie di dati da confrontare, con il solo gruppo A trasformato e quindi con mediana (183) uguale a quella del gruppo B, diviene

Gruppo A

128

153

177

182

184

221

228

243

---

---

---

---

Gruppo B

44

102

124

142

157

172

194

218

225

232

264

271

 

Se non hanno la stessa varianza (H0 falsa), quello con variabilità maggiore dovrebbe avere contemporaneamente sia valori minori sia valori maggiori in numero significativo; cioè una quota maggiore di valori collocati agli estremi;

mentre, se hanno la stessa varianza (H0 vera), i due gruppi dovrebbero avere la stessa quota di valori grandi e piccoli.

 

3 – Per valutare la significatività di una diversa presenza di valori collocati ai due estremi della distribuzione, si costruisce una distribuzione unica ordinata in modo crescente, mantenendo l’informazione del gruppo d’appartenenza.

 

44

102

124

128

142

153

157

172

177

182

184

194

218

221

225

228

232

243

264

271

B

B

B

A

B

A

B

B

A

A

A

B

B

A

B

A

B

A

B

B

 

Successivamente si attribuiscono i ranghi, dando il punteggio minore a quelli collocati agli estremi e maggiore a quelli collocati verso il centro, alternando il punto di partenza nei due estremi.

 

4 – In modo più dettagliato si attribuisce,

-          rango 1 al valore minore   e   rango 2 al valore maggiore (o ultimo),

-          rango 3 al penultimo valore   e   rango 4 al secondo valore,

-          rango 5 al terzo valore   e   rango 6 al terzultimo valore,

-          rango 7 al quartultimo valore    e   rango 8 al quarto,

fino ai ranghi massimi per i valori collocati al centro, come nella tabella sottostante

 

44

102

124

128

142

153

157

172

177

182

184

194

218

221

225

228

232

243

264

271

B

B

B

A

B

A

B

B

A

A

A

B

B

A

B

A

B

A

B

B

1

4

5

8

9

12

13

16

17

20

19

18

15

14

11

10

7

6

3

2

 

Su questa serie di ranghi, in cui i punteggi minori sono attribuiti ai valori collocati agli estremi e i punteggi maggiori ai valori centrali, si applica il test U di Mann-Whitney.

5 – A questo scopo, anche se esistono modalità differenti, più rapide ma meno intuitive, per calcolare le precedenze si ordinano i ranghi dal minore al maggiore, mantenendo l’informazione di gruppo

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

B

B

B

B

B

A

B

A

B

A

B

A

B

A

B

B

A

B

A

A

 

Dalla lettura della tabella appare evidente che i ranghi minori sono occupati dal gruppo B e i maggiori dal gruppo A.

Per ottenere U, con questa serie di ranghi è semplice calcolare quante volte i dati del gruppo B sono preceduti da dati del gruppo A.

 

6 - Si ottiene un conteggio, riportato nella tabella sottostante per ogni valore di B,

 

B

B

B

B

B

A

B

A

B

A

B

A

B

A

B

B

A

B

A

A

0

0

0

0

0

--

1

--

2

--

3

--

4

--

5

5

--

6

--

--

 

 che in totale determina

U  =  0 + 0 + 0 + 0 + 0 + 1 + 2 + 3 + 4 + 5 + 5 + 6  =  26

 un valore di U uguale a 26.

 

7 - Come verifica di aver calcolato il valore corretto di U, si può stimare U’, determinato dal numero di precedenze di B rispetto ad A e

 

B

B

B

B

B

A

B

A

B

A

B

A

B

A

B

B

A

B

A

A

--

--

--

--

--

5

--

6

--

7

--

8

--

9

--

--

11

--

12

12

 

 il cui totale risulta

U’  =  5 + 6 + 7 + 8 + 9 + 11 + 12 + 12  =  70

 uguale a 70,

 ricordando che

U + U’  =  n1 x n2   =  26 + 70  =  8 x 12  =  96

 

Per piccoli campioni si utilizza la tabella dei valori critici della distribuzione U di Man-Whitney, che può essere sia a due code con

H1

sia a una coda, quando sia prefissato quale gruppo dovrebbe avere variabilità maggiore.

Con i dati dell’esempio, alla probabilità a = 0.05 e con  = 8  e   = 12

per un test bilaterale, nella tabella il valore critico di U è uguale a 22; di conseguenza, non è possibile rifiutare l’ipotesi nulla, poiché il valore di U calcolato è maggiore (26).

 

Per grandi campioni, è preferibile utilizzare il test di Moses, che ha condizioni di validità meno rigide. Volendo utilizzare ugualmente il test di Siegel-Tukey proposto, per la significatività di U vedere l’approssimazione alla normale

Z =

 illustrato dettagliatamente nel paragrafo relativo.

 

Il test di Freund-Ansari-Bradley permette di verificare la stessa ipotesi del test precedente e nella prima parte (fino al punto 3) ha una metodologia identica.

 

1 - Utilizzando gli stessi dati di partenza,

 

Gruppo A

176

201

225

230

232

269

276

291

---

---

---

---

Gruppo B

44

102

124

142

157

172

194

218

225

232

264

271

 

 richiede il calcolo delle due mediane  (231 e 183, con differenza uguale a 48)

 

2 – e la sottrazione della differenza (48), in modo che i due gruppi abbiano la stessa mediana:

 

Gruppo A

128

153

177

182

184

221

228

243

---

---

---

---

Gruppo B

44

102

124

142

157

172

194

218

225

232

264

271

 

3 – Con le due serie si costruisce una sola serie ordinata, mantenendo l’informazione del gruppo di appartenenza:

 

44

102

124

128

142

153

157

172

177

182

184

194

218

221

225

228

232

243

264

271

B

B

B

A

B

A

B

B

A

A

A

B

B

A

B

A

B

A

B

B

 

 

4 – Come indicatore della diversa distribuzione dei dati di un gruppo agli estremi, con il test di Freund-Ansari-Bradley si attribuiscono

-          ranghi minori ai due estremi e

-          progressivamente maggiori avvicinandosi al centro.

Ad esempio,

-          il rango 1 è assegnato sia al primo valore, sia all’ultimo,

-          il rango 2 è assegnato sia al secondo valore, sia al penultimo,

-          il rango 3 sia al terzo valore, sia al terzultimo,

 ottenendo la seguente serie:

 

44

102

124

128

142

153

157

172

177

182

184

194

218

221

225

228

232

243

264

271

B

B

B

A

B

A

B

B

A

A

A

B

B

A

B

A

B

A

B

B

1

2

3

4

5

6

7

8

9

10

10

9

8

7

6

5

4

3

2

1

 

 

5 -  Come indicatore della differente variabilità dei dati dei due gruppi, si prende la somma dei loro  ranghi,

Somma dei Ranghi del Gruppo A  =  4 + 6 + 9 + 10 + 10 + 7 + 5 + 3  =  54

Somma dei Ranghi del Gruppo B  =  1 + 2 + 3 + 5 + 7 + 8 + 9 + 8 + 6 + 4 + 2 + 1  =  56

 

 di cui gli autori hanno stimato la tabella dei valori critici, in rapporto alla probabilità a e alle dimensioni n1 e n2 dei due campioni a confronto, sia per test unilaterali che bilaterali.

 

Gli autori hanno stimato anche l’efficienza asintotica relativa del loro test rispetto al test parametrico F di Fisher-Snedecor (il rapporto tra la varianza maggiore e quella minore), che

-          con una  distribuzione normale dei dati è uguale a circa 0,61 (6/p2),

-          con una distribuzione rettangolare dei dati è uguale a 0,60,

-          con una distribuzione esponenziale doppia è uguale a 0,94.

In questo caso, test non parametrico ha sempre una potenza inferiore a quello parametrico.

 

Il test di Conover per l’uguaglianza delle varianze è fondato sulle devianze dei due gruppi, ottenute calcolando per ogni valore

 il quadrato dello scarto rispetto alla media del suo gruppo.

 

Successivamente,

-          si sostituiscono le devianze ai valori e

-          si attribuiscono ad essi i ranghi come nel test di Wilcoxon- Mann- Whitney.

Di tale test si utilizza la tabella dei valori critici nel caso di piccoli campioni e l’approssimazione alla normale nel caso di campioni grandi.

 

Al posto della devianza, alcuni testi suggeriscono l’uso dello scarto assoluto

 che non varia l’ordine dei ranghi.

Il test di Conover appare meno potente del test di Siegel – Tukey.

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007