TEST NON PARAMETRICI

PER CORRELAZIONE, CONCORDANZA,

REGRESSIONE MONOTONICA E REGRESSIONE LINEARE

 

 

 

21.15. IL TEST DI HOLLANDER PER IL CONFRONTO TRA DUE COEFFICIENTI ANGOLARI

 

 

Quando in due campioni indipendenti bivariati C1 e C2 sono stati calcolati i due coefficienti angolari b1 e b2, può sorgere il problema di verificare se essi siano paralleli:

H0b1  =  b2

 

Tra i test proposti (come quello di R. F. Potthoff con l’articolo del 1965 A non parametric test of whether two simple regression lines are parallel nel volume University of North Carolina, Institute of Statistics Mimeno series 445, oppure quello di P. K. Sen per la verifica simultanea del parallelismo tra più coefficienti angolari con l’articolo del 1969 On a class of rank order test for the parallelism of several regression lines pubblicato in The Annals of Mathematical Statistics, vol. 40 pp. 1668-1683), attualmente il più diffuso nella ricerca sperimentale è quello illustrato da M. Hollander in modo completo nel 1970 (con l’articolo A distribution-free test for parallelism pubblicato su Journal of the American Statistical Association vol. 65, pp.387-394).

 

Per la significatività, il test di Hollander utilizza il test dei ranghi con segno di Wilcoxon per due campioni dipendenti; di conseguenza richiede le stesse condizioni di validità e come ipotesi alternativa accetta

-  sia test bilaterali

H0: b1  =  b2     contro     H1b1  ¹  b2

 

-  sia unilaterali nelle due differenti direzioni

H0 : b1  £  b2      contro      H1b1  >  b2  

H0 : b1  ³  b2      contro      H1b1  <  b2  

 

 secondo la domanda posto dal problema che si analizza.

E’ quindi analogo al test parametrico t di Student, per 2 campioni dipendenti.

 

Per un’illustrazione semplice e facilmente comprensibile, è utile scomporre la metodologia di Hollander in sette  passaggi logici fondamentali.

 

1 – Per l’applicazione del test di Hollander, è indispensabile il rispetto di una prima condizione preliminare: in ognuno dei due campioni C1 e C2, il numero di osservazioni non può essere di poche unità, ma deve essere abbastanza grande, superiore almeno ad una decina; infatti, nella fase finale entro lo stesso campione si devono formare due campioni dipendenti di dimensioni n, per cui il numero di osservazioni N si dimezza.

 

2 – La seconda condizione preliminare, insita nei concetti appena espressi sull’appaiamento dei dati, riguarda le dimensioni dei due campioni C1 e C2, dei quali si vogliono confrontare i relativi coefficienti angolari: entrambi devono avere un numero N d’osservazioni pari (N = 2n). Nel caso in cui il numero N d’osservazioni sia dispari, si elimina un’osservazione a caso.

 

3 – La terza condizione preliminare è che i due campioni devono avere lo stesso numero d’osservazioni; di conseguenza, se si deve eliminare un’osservazione l’operazione deve essere eseguita su entrambi i campioni.

 

4 – Nel campione C1 si stimano n coefficienti angolari b1,k accoppiando i valori di Y1,k e X1,k  rispettivamente con quelli di  Y1,k+nX1,k+n


 

b1,k = ,      k = 1, 2, …, n.

 

 

5 – nello stesso modo, per il campione C2 si stimano n coefficienti angolari b2,k accoppiando i valori di Y2,k e X2,k  rispettivamente con quelli di  Y2,k+nX2,k+n

 

b2,k = ,      k = 1, 2, …, n.

 

6 – Si formano coppie a caso tra un valore b1,k e di un valore b2,k, calcolando n differenze dk

dk = b1,i – b2,j

con il loro segno.

 

7 – Su queste n differenze dk con segno, si applica il test di Wilcoxon dei ranghi con segno.

Infatti dopo aver trasformato i valori ottenuti nei loro ranghi, mantenendo il segno,

- se è vera l’ipotesi nulla

H0b1  =  b2

 la somma dei ranghi positivi e di quelli negativi tenderà ad essere uguale e quindi quella minore tenderà al valore medio,

- mentre se è vera l’ipotesi alternativa bilaterale

H1b1  ¹  b2

 oppure una delle 2 ipotesi unilaterali prefissate

H1b1  <  b2   oppure    H1b1  >  b2

 la somma minore tenderà a 0.

 

Come esempio d’applicazione di questa metodologia, in vari testi di statistica non parametrica è riportato un esempio pubblicato da A. C. Wardlaw e G. van Belle nel 1964 (con l’articolo Statistical aspect of the mouse diaphragm test for insulin, sulla rivista Diabetes n. 13, pp. 622-633).

Il caso è interessante anche per la ricerca biologica e ambientale, poiché illustra il confronto tra due rette calcolate con due soli punti o meglio sue soli valori di X per i quali si abbiano misure ripetute della Y. E’ una situazione sperimentale che ricorre con frequenza nelle ricerche di ecotossicologia o comunque nella valutazione degli effetti di un dosaggio con due soli punti, per i quali non è possibile applicare la regressione parametrica.


 

ESEMPIO.   E’ stata valutata la capacità di un ormone, somministrato a 2 dosi differenti (X1 = 0,3   e   X2 = 1,5), di stimolare la sintesi di glicogeno, misurata in termini di densità ottica (Yi), in presenza di insulina di 2 tipi differenti (C1 =  insulina standard;  C2 =  campione di insulina da saggiare). Si vuole verificare se, nelle due differenti condizioni sperimentali, le due rette dose-risposta sono parallele; in termini biologici, se si ha una risposta simile all’aumentare della dose, pure considerando gli effetti di una diversa concentrazione del principio attivo.

A questo scopo,

-  sono state ottenute 12 misure nella condizione C1 e 12 nella condizione C2,

-  delle quali 6 alla dose 0,3 e 6 alla dose 1,5 (riportati nella tabella seguente).

 

 

 

Prova

C1

C2

X1,j

Y1,j

X2,j

Y2,j

1

Log 0,3

230

log 0,3

310

2

Log 0,3

290

log 0,3

265

3

Log 0,3

265

log 0,3

300

4

Log 0,3

225

log 0,3

295

5

log 0,3

285

log 0,3

255

6

log 0,3

280

log 0,3

280

7

log 1,5

365

log 1,5

415

8

log 1,5

325

log 1,5

375

9

log 1,5

360

log 1,5

375

10

log 1,5

300

log 1,5

275

11

log 1,5

360

log 1,5

380

12

log 1,5

385

log 1,5

380

 

 

Com’è prassi in questi casi, per rendere lineare la risposta, in sostituzione del valore della dose è stato utilizzato il suo logaritmo (log dose).

 

Il metodo di Hollander per la verifica del parallelismo tra le due rette segue questi passaggi logici.

 

1 – Dapprima si verifica che nella programmazione dell’esperimento siano state rispettate le tre condizioni preliminari richieste:

-   numero di osservazioni per campione superiore a 10: sono  N = 12);

-   numero di osservazioni entro ogni campione pari e uguale per le due dosi: sono 6 per dose;

-   numero di osservazioni uguali per i due campioni: sono 12 in entrambi.

 

2 – Successivamente, si calcolano misure ripetute del coefficiente angolare bi,k in entrambi i campioni


 

bi,k =

 abbinando

-   la prima osservazione del dosaggio 0,3 con la prima osservazione del dosaggio 1,5

-   la seconda osservazione del dosaggio 0,3 con la seconda osservazione del dosaggio 1,5

 e così fino a

-   la sesta osservazione del dosaggio 0,3 con la sesta osservazione del dosaggio 1,5

 ottenendo i seguenti risultati:

 

- per il campione C1

b1,1 =

b1,2 =

b1,3 =

b1,4 =

b1,5 =

b1,6 =

 

- per il campione C2

b2,1 =

b2,2 =

b2,3 =

b2,4 =

b2,5 =

b2,6 =

 

 

3 – Si accoppiano casualmente, con estrazione di numeri random, i 6 valori bi,j del campione C1 con i 6 valori del campione C2 e si calcolano le differenze; nell’esempio riportato da Wardlaw e van Belle sono stati ottenuti gli accoppiamenti e le differenze

 

dk = b1,i – b2,j

 

 di seguito riportati, con tutti i calcoli

 

d1 = b1,1 – b2,1 = 193,1 – 150,2 =  42,9

d2 = b1,2 – b2,2 = 50,1 – 157,4 =  - 107,3

d3 = b1,3 – b2,4 = 135,9 – -28,6 =  164,5

d4 = b1,4 – b2,5 = 107,3 – 178,8 =  - 71,5

d5 = b1,5 – b2,6 = 107,3 – 143,1 =  - 35,8

d6 = b1,6 – b2,3 = 150,2 – 107,3 = 42,9

 

 

4 – Infine a queste 6 differenze si applica il test T di Wilcoxon per 2 campioni dipendenti:

 

 a) dopo averle ordinate in modo crescente, considerando il loro valore assoluto

- 35,8    42,9    42,9    -71,5    -107,3    164,5

 

 b) si attribuisce il rango, considerando che due valori (42,9) sono uguali

1     2,5     2,5     4     5     6

 

 c) si riporta il segno dei valori originari

-1     +2,5     +2,5     -4     -5     +6

 

 d) calcolando la somma dei ranghi positivi, che risulta uguale a 11

 

 e) e la somma dei negativi, che risulta uguale a 10.

 

Il valore di T è la somma minore e quindi è uguale a 10.

 

 

5 –Dopo aver stimato T, per calcolare la significatività occorre stabilire la direzione del confronto: se bilaterale oppure unilaterale.

 

Questo test sul parallelismo, come presentato dal problema, è bilaterale.

Poiché sulla tabella dei valori critici per il test T di Wilcoxon per 2 campioni dipendenti, con N uguale a 6 e per un test a due code, il valore riportato è 2, non si può rifiutare l’ipotesi nulla. Per una conclusione più articolata, è conveniente mettere in evidenza che la somma dei negativi  (10) e la somma dei positivi (11) sono tra loro molto vicine, come atteso quando l’ipotesi nulla è vera; pertanto, in termini di parallelismo tra le due rette, si deve concludere che non solo non si può rifiutare l’ipotesi nulla ma la probabilità che le due rette siano parallele è molto elevata.

 

Della metodologia presentata, un punto di debolezza, criticato da vari autori,

-  è l’accoppiamento casuale delle stime delle bi,k nei due campioni, per calcolare le n differenze dk.

 

Appunto perché generato in modo casuale, può fornire risposte diverse a partire dagli stessi dati. Come in tutti questi casi, ovviamente non è assolutamente accettabile la ripetizione fino ad ottenere la risposta desiderata o più vicina a quanto atteso.

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007