TEST NON PARAMETRICI

PER PIU' CAMPIONI

 

 

 15.3.   CENNI SUL TEST DI NEMENYI E ALTRI PER LA MEDIANA IN K GRUPPI

 

 

Il test di Nemenyi per la mediana (a lui si devono altri test tra cui i confronti multipli non parametrici) non è particolarmente potente; ma è riportato in qualche pacchetto statistico a grande diffusione internazionale e quindi è citato in alcune pubblicazioni scientifiche al posto del test della mediana. Di conseguenza, può essere utile conoscerne i concetti fondamentali. A grandi linee, può essere visto come una diversa elaborazione del test della mediana e serve per verificare le stesse ipotesi.

 

Nel confronto tra più gruppi, l’ipotesi nulla resta

H0: meA = meB = … = meK

 

 e l’ipotesi alternativa, solo bilaterale, è ancora

H1: le mediane non sono tutte uguali

 

Il test di Nemenyi richiede due condizioni sperimentali più restrittive del precedente test sulla mediana, che ne limitano sensibilmente le possibilità di utilizzazione:

-          i k gruppi a confronto devono avere lo stesso numero d’osservazioni,

-          i campioni devono essere di grandi dimensioni.

Ha pure il grave svantaggio di richiedere tabelle di valori critici difficilmente reperibili (qui non riportati).

Il lavoro originale di P. Nemenyi (Distribution-free multiple comparisons, unpublished doctoral thesis, Princeton University, 1963) è citato in alcuni testi di statistica non parametrica, ma non è mai stato pubblicato. Il test è da ricordare, in quanto presente in alcuni programmi informatici a partire dalla metà degli anni ‘60, in particolare in quelli prodotti dal Dipartimento di Statistica della Università di Princeton, dotato di una struttura di ricerca di fama mondiale nella statistica applicata.

 

La metodologia,  differente dal test della mediana solo nella parte conclusiva,  richiede che:

1- nella programmazione dell’esperimento si raccolga un numero d’osservazioni identico in tutti i gruppi a confronto

n1 = n2 = … = nk

come nell’esempio seguente con 4 gruppi (che in realtà hanno un numero d’osservazioni troppo limitato, per un’applicazione corretta)

 

GRUPPO

A

B

C

D

< 1

3,7

2,1

3,8

<1

2,8

2,5

2,2

3,8

0,9

2,9

5,2

2,1

2,2

>10

>10

3,2

2,5

8,7

>10

 

 

2 - Dopo aver definito l’ipotesi nulla

H0: meA = meB = … = meK

 con ipotesi alternativa bilaterale

H1: le mediane non sono tutte uguali

 

3 - ordinare per ranghi tutte le osservazioni dei k gruppi a confronto come se fossero un gruppo unico, mantenendo per ogni valore l'informazione del gruppo di appartenenza

 

<1

<1

0,9

2,1

2,1

2,2

2,2

2,5

2,5

2,8

mediana

segue

A

A

B

A

C

B

D

B

C

B

 

2,9

3,2

3,7

3,8

3,8

5,2

8,7

>10

>10

>10

C

A

B

A

D

D

C

C

D

D

 

 

4 – Successivamente, identificare la mediana di questa distribuzione unica (nella tabella precedente è a metà tra il 10° e l’11° valore) e, per ogni gruppo,

 

 

GRUPPI

<  mediana

>  mediana

Totale

A

3

fA  =  2

5

B

4

fB  =  1

5

C

2

fC  =  3

5

D

1

fD  =  4

5

 

 

 contare quante sono le osservazioni che hanno valore superiore alla mediana (l'eventuale valore corrispondente alla mediana è classificato in uno dei due gruppi, anche se non dovrebbero risultare sbilanciati).

Nella distribuzione dei valori sopra e sotto la mediana, costruita come nel test relativo, si prendono in considerazione solo le frequenze superiori alla mediana; si utilizza solo una serie di frequenze f1, f2,   , fk  (quelle riportate il grassetto nella tabella precedente).

 

5 - Con k gruppi e quindi k frequenze di valori superiori alla mediana, sono possibili k(k – 1)/2 confronti 2 a 2, tra le frequenze assolute fi.

Da esse si deriva l’indice h, determinato dalla differenza massima in valore assoluto

 h  =  max |fi - fj|

 

Con i dati dell’esempio, fra i 6 possibili confronti 2 a 2, si sceglie quello di B con D

h = |1 – 4| = 3

 che fornisce la differenza assoluta massima  h = 3.

 

6 - Attraverso tavole dei valori critici, è possibile stimare la probabilità di ottenere per caso, nella condizione che l’ipotesi nulla sia vera, uno scarto uguale o superiore a quello stimato.

I programmi informatici riportano la probabilità P. Tale valore, confrontato con quello a prescelto, permette di decidere se è possibile rifiutare l’ipotesi nulla.

 

Per gli stessi scopi, in letteratura si trovano altri test. Fra questi, è possibile ricordare:

- il test di Rijkoort, proposto nel 1952, che si fonda su modalità simili alla somma dei ranghi utilizzata nel test di T Wilcoxon; 

- il test proposto congiuntamente da Brown e Mood nel 1951, affine a quello della mediana;

- il test di Bhapkar del 1961;

- il test di Deshpandé ed il test di Sugiura, elaborati in modo indipendente nel 1965 e riproposti insieme con correzioni nel 1968, che utilizzano il calcolo delle precedenze e quindi sono una estensione del test U.

Poiché sono test per ora riportati i in pochissimi programmi informatici ed analoghi a quelli già illustrati in modo dettagliato,  per la loro presentazione si rimanda a testi specifici.

 

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007