METODI NON PARAMETRICI PER DUE CAMPIONI INDIPENDENTI

 

 

 

9.14.   Il test dei ranghi equivalenti di Moses per le differenze nella dispersione o variabilità

 

 

Tra i vari test proposti per misurare la dispersione o variabilità di due serie di osservazioni, il test di Moses  (Moses run like test) proposto nel 1963 e nel 1964 (L. E. Moses Rank test of dispersion in Ann. Math. Statist. n. 34, pp. 973-983;  One sample limits of some two-sample rank test in J. Amer. Statist. Ass. vol. 59, pp. 645-651) è quello di più generale applicazione: non richiede la conoscenza delle mediane delle due popolazioni; ma solo l'uso di una scala d'intervallo o di rapporti, poiché utilizza misure della devianza (è possibile utilizzare anche la varianza, ma si richiede un’operazione aggiuntiva).

 

Le ipotesi da verificare riguardano la varianza dei due campioni.

L’ipotesi può essere

-          bilaterale con

 H0 :  =       contro      H1 :  ¹

-          unilaterale

 sia in una direzione

H0 :  £       contro      H1 :  >  

 sia nell’altra

H0 :  ³       contro      H1 :  <

 

Lo sviluppo di un esempio permette una illustrazione didattica più chiara e semplice di un elenco di passaggi logici ed operativi.

 

Si supponga di avere raccolto due serie di misure, chiamate gruppo A e gruppo B

 

 

GRUPPO  A

8,4

7,6

9,2

8,2

9,7

6,4

5,6

8,1

---

---

---

GRUPPO  B

5,4

3,7

6,8

5,3

9,1

4,1

8,6

8,2

3,9

4,2

6,7

Posizione

1

2

3

4

5

6

7

8

9

10

11

 

 

 per verificare se esiste una differenza significativa tra la variabilità o dispersione dei due gruppi.

La metodologia richiede alcuni passaggi per l’elaborazione dei dati sperimentali raccolti.

 

1 - Per ognuno dei due gruppi a confronto, mediante estrazione casuale, formare sottogruppi o sotto-insiemi con almeno 2 osservazioni.

Questi sottoinsiemi devono essere composti riunendo casualmente (per estrazione di numeri random) le osservazioni presenti entro ogni gruppo.

 

Le osservazioni che non formano un sottinsieme completo devono essere eliminate.

Ai fini dei confronti successivi, è utile che ogni gruppo abbia almeno 4-5 sottoinsiemi.

Poiché il gruppo A è formato da soli 8 dati ed il gruppo B da 11 dati, è conveniente formare sottoinsiemi con due sole osservazioni.

 

Mediante estrazione casuale, con i dati dell’esempio per il gruppo A sono risultati abbinati i numeri che occupano le posizioni 1-5, 8-7, 6-4, 2-3.

Con un numero pari di osservazioni e sottoinsiemi di 2 elementi, in questo gruppo non esistono numeri da scartare.

 

Per il gruppo B sono risultati abbinati i numeri che occupano le posizioni 6-1, 2-5, 11-9, 8-10, 4-7.

Il numero che occupa la posizione 3 viene escluso dalle analisi successive, in quanto parte di un sottoinsieme incompleto.


GRUPPO                SOTTOINSIEMI DI 2 DATI

 

Gruppo  A

1)

8,4

9,7

 

2)

8,1

5,6

 

3)

6,4

8,2

 

4)

7,6

9,2

Gruppo  B

1)

4,1

5,4

 

2)

3,7

9,1

 

3)

6,7

3,9

 

4)

8,2

4,2

 

5)

5,3

8,6

 

 

2 - Per ogni sottoinsieme calcolare la devianza (SQ)

di cui si ricorda la formula generale

e la formula abbreviata

=

 

Con i dati dell’esempio, si ottengono 4 devianze per il gruppo A e 5 devianze per il gruppo B:


 

    GRUPPO                SOTTOINSIEMI DI 2 DATI      DEVIANZE

Gruppo  A

1)

8,4

9,7

0,845

 

2)

8,1

5,6

3,125

 

3)

6,4

8,2

1,620

 

4)

7,6

9,2

1,280

Gruppo  B

1)

4,1

5,4

0,770

 

2)

3,7

9,1

0,080

 

3)

6,7

3,9

3,920

 

4)

8,2

4,2

8,000

 

5)

5,3

8,6

5,445

 

dei quali sono riportati i valori.

 

3 - Alle devianze dei due gruppi applicare il test U di Wilcoxon-Mann-Whitney per due campioni indipendenti, secondo l’ipotesi H1 espressa.

E’ il test per due campioni indipendenti più adatto per verificare la significatività di differenze nelle tendenze centrali delle devianze calcolate.

Nell’esercizio, lo scopo è di verificare se questi indici di dispersione (le devianze) dei due gruppi hanno la medesima tendenza centrale o sono significativamente diversi. E’ un test bilaterale.

 

Per applicare il test U di Mann-Whitney, fondato sulle precedenze, ordinare i valori dei due gruppi in ordine crescente come se fossero un insieme unico, mantenendo per ogni devianza l'informazione del gruppo di appartenenza.

 

DEVIANZE

0,080

0,770

0,845

1,280

1,620

3,125

3,920

5,445

8,000

GRUPPO

B

B

A

A

A

A

B

B

B

 

Con i dati dell’esempio, si hanno 9 valori di devianze nell’ordine riportato.

 

4 - Contare il numero di precedenze di ogni gruppo


 

DEVIANZE

0,080

0,770

0,845

1,280

1,620

3,125

3,920

5,445

8,000

GRUPPO

B

B

A

A

A

A

B

B

B

Precedenze del gruppo A

---

---

2

2

2

2

---

---

---

 

 

Per il gruppo A le precedenze sono in totale 8, mentre per il gruppo B

 

DEVIANZE

0,080

0,770

0,845

1,280

1,620

3,125

3,920

5,445

8,000

GRUPPO

B

B

A

A

A

A

B

B

B

Precedenze del gruppo B

0

0

---

---

---

---

4

4

4

 

  le precedenze sono 12.

Come valore di U si deve scegliere la somma minore.

Nell’esercizio, il valore di U risulta uguale a 8.

 

5- Stimare la significatività, con la tabella dei valori critici nel caso di piccoli campioni e con la distribuzione normale nel caso di grandi campioni (vedere metodo del test U di Mann-Whitney).

I dati dell’esempio formano due campioni piccoli.

Il numero massimo di precedenze riportato nella tabella dei valori critici di U

-  alla probabilità a = 0.05  per n1 = 4  e   n2 = 5  in un test bilaterale è 1.

Il numero di precedenze U calcolato (8) è maggiore di quello tabulato (1): non si può rifiutare l’ipotesi nulla. I due gruppi a confronto hanno una variabilità dei dati non significativamente differente.

 

Moses ha studiato l’efficienza asintotica relativa del suo test rispetto a quella del test F di Fisher. Essa dipende da k, il numero di osservazioni utilizzate per costruire i sotto insiemi

 

Nel caso di dati distribuiti normalmente

la potenza-efficienza è                          0,30 quando k = 2

                                                             0,50 quando k = 3

                                                             0,61 quando k = 4

per crescere lentamente fino a               0,88 quando k = 15

e                                                           0,96 quando k tende all’infinito.

Nel caso di dati distribuiti come una esponenziale doppia, la potenza varia da 0,59 a 0,96.

 

Rispetto al test di Freund-Ansari-Bradley, nel caso di una distribuzione normale, il test di Moses

-  è meno potente quando i sottoinsiemi sono composti da 2 o 3 unità,

-  ha la stessa potenza quando sono formati da 4 unità,

-  ha una potenza di 1,44 con 20 dati.

 

Il test di Moses è meno potente dell’altro test non parametrico, quando i dati hanno una distribuzione molto lontana dalla normalità e asimmetrica, come l’esponenziale doppia.

 

 

ESEMPIO.   Due gruppi del Cladocero Daphnia magna, geneticamente identici, sono stati allevati in condizioni ambientali differenti: il gruppo A in abbondanza di cibo e il gruppo B in carenza, per verificare se questi ultimi sono caratterizzati da una variabilità maggiore.

Alla fine del periodo di crescita, con il microscopio binoculare sono state misurate le lunghezze (in millimetri) di tutti gli individui dei due gruppi, come riportato nella tabella sottostante.

 

Gruppo

A

4,290

3,900

3,783

3,900

4,095

4,329

4,173

4,095

4,095

4,056

3,939

3,978

4,017

4,251

4,017

---

---

---

---

---

 

Gruppo

B

3,120

3,112

3,120

2,847

3,081

3,042

3,042

3,042

3,081

2,964

3,120

2,964

3,003

3,081

3,042

2,925

3,198

3,120

2,964

3,003

 

 

Risposta. E’ un test con ipotesi nulla

H0:

 ed ipotesi alternativa

H1:  <

 ad una coda.

Infatti, si vuole verificare se la dispersione dei dati del gruppo B è significativamente maggiore di quella del gruppo A.

Con i dati dell'esempio, disponendo di 15 osservazioni nel gruppo A e 20 nel gruppo B, per non avere un numero troppo ridotto di sotto-insiemi si può scegliere di formare sottogruppi di 3 unità. Con due sole unità si avrebbe il vantaggio di utilizzare un numero maggiore di devianze, ma con lo svantaggio di una loro minore stabilità.

 

Con

-          il gruppo A si formano 5 sotto-insiemi,

-          il gruppo B si formano 6 sottoinsiemi,

 come riportato nella tabella successiva:

 

               GRUPPO                            SOTTOINSIEMI DI TRE DATI              DEVIANZE

Gruppo  A

1)

3,900

4,290

4,329

0,1120

 

2)

3,783

4,095

4,251

0,1135

 

3)

3,978

4,017

3,900

0,0073

 

4)

4,017

4,095

3,939

0,0121

 

5)

4,056

4,173

4,095

0,0070

Gruppo  B

1)

3,112

3,120

3,042

0,0040

 

2)

3,120

3,081

3,081

0,0015

 

3)

2,964

3,003

3,120

0,0135

 

4)

3,042

3,042

3,120

0,0041

 

5)

2,964

3,042

3,003

0,0030

 

6)

2,847

3,081

2,925

0,0288

 

I rimanenti 2 valori del gruppo B (2,964 e 3,198) sono eliminati dalle analisi successive, perché insufficienti a formare un sotto-insieme completo.

Come riportato nella tabella precedente, per ogni tripletta di dati è stata calcolata la devianza SQ con la formula abbreviata

=


Alle due serie di devianze,

 

Devianze  A

0,1120

0,1135

0,0073

0,0121

0,0070

 

Devianze  B

0,0040

0,0015

0,0135

0,0041

0,0030

0,0288

 

è possibile applicare il test U di Wilcoxon-Mann-Whitney, per verificare se il gruppo B ha indici di dispersione maggiori di quelli calcolati per A.

 

Per applicare il test, si dispongono i valori dei due gruppi insieme in ordine crescente, mantenendo l'informazione del gruppo d’appartenenza.

Successivamente occorre fare la somma delle precedenze per calcolare U

 

.0015

.0030

.0040

.0041

.0070

.0073

.0121

.0135

.0288

.1120

.1135

B

B

B

B

A

A

A

B

B

A

A

0

0

0

0

---

---

---

3

3

---

---

 

che risulta uguale a 6.

 

I due campioni a confronto sono di piccole dimensioni.

Per l’uso della tabella dei valori critici si definisce

-           il campione con il numero minore di dati

-           quello con il numero maggiore.

Con i dati dell’esempio, per = 5  e  = 6

-          il valore critico alla probabilità a = 0.05 per test unilaterali (riportato nella tabella dei valori critici di U) è uguale a 5,

-          mentre il valore calcolato è 6.

Non è possibile rifiutare l’ipotesi nulla.

Non è dimostrato che la varianza del gruppo B sia maggiore di quella del gruppo A..

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007