METODI NON PARAMETRICI PER DUE CAMPIONI DIPENDENTI

 

 

8.6.   INTERVALLO DI CONFIDENZA DI UNA DIFFERENZA CON IL TEST DEI SEGNI  E IL TEST T DI WILCOXON

 

 

Come già evidenziato nel caso di un campione, anche con due campioni dipendenti si pone il problema di stimare l’intervallo di confidenza della tendenza centrale di una serie di differenze, per valutare quale sia la differenza reale, quando si dispone di dati che non permettono o sconsigliano l’uso della distribuzione Z o della distribuzione t di Student.

Per stimare la tendenza centrale, può essere necessario calcolare un intervallo di confidenza fondato

-          sul test dei segni, che ricorrere alla distribuzione binomiale,

-          sul test T di Wilcoxon, che ricorre alla distribuzione di probabilità dei valori T.

Il valore di riferimento della tendenza centrale è

-          la mediana con il test dei segni

-          la mediana delle medie di Walsh (Walsh averages) con il test T di Wilcoxon.

Sono tutte stime della tendenza centrale e permettono il confronto con la media; se la distribuzione è simmetrica, coincidono con essa.

I concetti e la metodologia sono già stati spiegati nel capitolo precedente.

Con lo scopo, già dichiarato nella presentazione, di prendere come riferimento i testi di statistica più diffusi a livello internazionale e di rinviare ad essi per ulteriori approfondimenti, con l’aggiunta di qualche elaborazione nei calcoli i prossimi tre esempi sono tratti

-          i primi due dal testo di P. Sprent del 1993 (Applied Nonparametric Statistiscal Methods, 2nd ed., Chapman & Hall, London, 341 p.),

-          il terzo dal testo di Peter Armitage e Geoffrey Berry del 1994 (Statistical Methods in Medical Research, Blackwell Scientific Publication Limited, Oxford), tradotto in italiano da Antonello Sciacchitano nel 1996 (Statistica Medica, metodi statistici per la ricerca in Medicina, McGraw-Hill Libri Italia, Milano, XIV + 619 p.).

 

ESEMPIO 1 (con il test dei segni e confronto dei risultati con test T di Wilcoxon e test t di Student)

Ad un campione di 24 studenti, è stata misurata la pressione sistolica, prima e dopo un esercizio fisico impegnativo.

La differenza tra le due serie di valori accoppiati (Dopo – Prima)  ha determinato i seguenti 24 dati, già ordinati per rango

 

Rango

1

2

3

4

5

6

7

8

9

10

11

12

-5

-5

0

2

10

15

15*

15

18

20

20

20

 

 

Rango

13

14

15

16

17

18

19

20

21

22

23

24

20

22

30

30

34

40*

40

40

41

47

80

85

 

 

Quale è l’intervallo di confidenza della differenza (Dopo – Prima), alla probabilità a = 0.05?

 

Risposta.

1 - La semplice riorganizzazione delle 24 differenze per rango indica che la mediana, cadendo tra il 12° e il 13° valore, è 20.

 

2 - Per individuare l’intervallo di confidenza, occorre escludere quei valori che hanno complessivamente una probabilità P £ 0.025 in ognuna delle due code della distribuzione.

Mediante la distribuzione binomiale

Pi =

 

  e variando progressivamente r a partire da 0

 si trovano  le probabilità

P0 =

P1 =

P2 =

P3 =

 e si sommano i risultati

P = P0 + P1 + P2 + P3 +…

 

 fino a quando il loro totale resta inferiore al valore a/2 prefissato.

 

Con N abbastanza grande (come N = 24) il calcolo diventa lungo; pertanto

-          si può utilizzare un programma informatico oppure

-          ricorrere ad una tabella di probabilità, come quella riportata nella pagina successiva.

 

 

3 - Nella tabella riportata nella pagina successiva, per N = 24 e alla probabilità a = 0.05 bilaterale, si trova r = 6.

Significa che, nella distribuzione ordinata per ranghi dei 24 valori, si devono escludere i 6 valori più estremi in ognuna delle due code della distribuzione. Di conseguenza, l’intervallo di confidenza è compreso tra 15 e 40, cioè

15 < q < 40

 

Sono i valori evidenziati e con l’asterisco, nella distribuzione ordinata delle differenze riportata in precedenza con i ranghi a 1 a 24.

 

Sempre per N = 24 ma alla probabilità a = 0.01 bilaterale, nella tabella si trova il valore r = 5. Di conseguenza, per effetto delle misure ripetute presenti nella distribuzione, a questa probabilità l’intervallo di confidenza è ancora compreso tra 15 e 40, cioè

15 < q < 40

 

Il testo di Sprent riporta l’intervallo alla probabilità a = 0.05, sempre calcolato su questi dati, per

-          il test T di Wilcoxon: 17,5 < q < 33,5

-          il test t di Student: 16,86 < q < 35,96.

In questo caso, il test di Wilcoxon (al quale sono dedicati i due esempi successivi) risulta più potente e quindi determina un intervallo minore di quello stimato con il test t di Student.

La causa è da identificare nella presenza dei due valori estremi maggiori (80 e 85): essi si discostano sensibilmente dagli altri, determinando asimmetria nella distribuzione e quindi una varianza grande.

E’ evidente la convenienza dell’uso del test di Wilcoxon rispetto al test di Student.

 

I valori critici di r riportati nella tabella precedente, come già spiegato nel capitolo precedente seppure con una impostazione differente, nel caso di grandi campioni possono essere derivati con una buona approssimazione dalla distribuzione normale,

mediante il rapporto

 

VALORI CRITICI DI r PER IL TEST DEI SEGNI

OTTENUTI CON LA DISTRIBUZIONE BINOMIALE CUMULATA PER P = 0.5

 

 

N

a bil.

0.50

0.20

0.10

0.05

0.02

0.01

0.005

0.001

a uni.

0.25

0.10

0.05

0.025

0.01

0.005

0.0025

0.0005

4

 

0

0

---

---

---

---

---

---

5

1

0

0

---

---

---

---

---

6

1

0

0

0

---

---

---

---

7

2

1

0

0

0

---

---

---

8

2

1

1

0

0

0

---

---

9

2

2

1

1

0

0

0

---

10

3

2

1

1

0

0

0

---

11

3

2

2

1

1

0

0

0

12

4

3

2

2

1

1

0

0

13

4

3

3

2

1

1

1

0

14

5

4

3

2

2

1

1

0

15

5

4

3

3

2

2

1

1

16

6

4

4

3

2

2

2

1

17

6

5

4

4

3

2

2

1

18

7

5

5

4

3

3

2

1

19

7

6

5

4

4

3

3

2

20

7

6

5

5

4

3

3

2

21

8

7

6

5

4

4

3

2

22

8

7

6

5

5

4

4

3

23

9

7

7

6

5

4

4

3

24

9

8

7

6

5

5

4

3

25

10

8

7

7

6

5

5

4

26

10

9

8

7

6

6

5

4

27

11

9

8

7

7

6

5

4

28

11

10

9

8

7

6

6

5

29

12

10

9

8

7

7

6

5

30

12

10

10

9

8

7

6

5

35

15

13

12

11

10

9

8

7

40

17

15

14

13

12

11

10

9

45

19

17

16

15

14

13

12

11

50

22

19

18

17

16

15

14

13

55

24

22

20

19

18

17

16

14

60

26

24

23

21

20

19

18

16

65

29

26

25

24

22

21

20

18

70

31

29

27

26

24

23

22

20

75

34

31

29

28

26

25

24

22

80

36

33

32

30

29

28

27

24

85

38

36

34

32

31

30

29

26

90

41

38

36

35

33

32

31

29

95

43

40

38

37

35

34

33

31

100

46

43

41

39

37

36

35

33

 


 

Ad esempio,

-          con N = 40 e alla probabilità a = 0.05 (Z = 1,96) si ottiene

 

  13,8 che, ovviamente trattandosi di interi, deve essere arrotondato a 13.

-          con N = 100 e sempre alla probabilità a = 0.05 (Z = 1,96) si ottiene

 

  40,2 che, ovviamente trattandosi di interi, deve essere arrotondato a 40.

(Con N = 40 anche la tabella riporta 13; con N = 100 la tabella, più precisa, riporta 39).

 

ESEMPIO 2 (Con il test T di Wilcoxon e le Walsh averages).   Si è voluto verificare se esistono differenze nel tempo di percezione di uno stimolo visivo tra occhio destro e occhio sinistro. A questo scopo, sono state presentate lettere in ordine casuale a 12 individui, ottenendo i seguenti risultati (in ms)

 

 

Soggetti

A

B

C

D

E

F

G

H

I

L

M

N

Sinistro

564

521

495

564

560

481

545

478

580

484

539

467

Destro

557

505

465

562

544

448

531

458

560

485

520

445

= (S-D)

7

16

30

2

16

33

14

20

20

-1

19

22

 

 

Una lettura attenta dei dati evidenzia che

-          la differenza massima per lo stesso individuo è 33,

-          la differenza massima tra individui, che potrebbe essere calcolata sulla media tra i loro due campi visivi, è intorno a 100.

Il test per due campioni dipendenti permette di eliminare questa differenza individuale nei tempi di reazione; quindi evidenzia meglio la differenza tra i due campi visivi.

Il test per due campioni dipendenti è più potente di quello per due campioni indipendenti.

 

Per valutare quale è la differenza reale della capacità visiva tra occhio destro e occhio sinistro,

 

1 – si ordinano le differenze per rango

 

Rango

1

2

3

4

5

6

7

8

9

10

11

12

= (S-D)

-1

2

7

14

16

16

19

20

20

22

30

33

 

 

2 – e per esse, come già spiegato nel capitolo precedente, si calcolano le 78 (12 x 13 / 2) Walsh averages, ottenendo

 

 

 

-1

2

7

14

16

16

19

20

20

22

30

33

-1

-1

0,5

3

6,5

7,5

7,5

9

9,5

9,5

10,5

14,5

16

2

 

2

4,5

8

9

9

10,5

11

11

12

16

17,5

7

 

 

7

10,5

11,5

11,5

13

13,5

13,5

14,5

18,5

20

14

 

 

 

14

15

15

16,5

17

17

18

22

23,5

16

 

 

 

 

16

16

17,5

18

18

19

23

24,5

16

 

 

 

 

 

16

17,5

18

18

19

23

24,5

19

 

 

 

 

 

 

19

19,5

19,5

20,5

24,5

26

20

 

 

 

 

 

 

 

20

20

21

25

26,5

20

 

 

 

 

 

 

 

 

20

21

25

26,5

22

 

 

 

 

 

 

 

 

 

22

26

27,5

30

 

 

 

 

 

 

 

 

 

 

30

31,5

33

 

 

 

 

 

 

 

 

 

 

 

33

 

Walsh averages delle 12 differenze

 

 

3 – La mediana di questi 78 valori (17.5) è lo stimatore di Hodges-Lehmann, che indica il valore della tendenza centrale della distribuzione dei dati

 

4 – Per calcolare l’intervallo di confidenza alla probabilità a = 0.05, dalla tabella dei valori critici del test di Wilcoxon per N = 12 si ricava T = 13. Significa che l’intervallo di confidenza alla probabilità prefissata esclude le 13 medie di Walsh minori e le 13 maggiori. Quindi è compreso tra 9,5 e 23,5; cioè

9,5 < q < 23,5

 

Nel commento dei risultati, Sprent evidenzia:

-          assumendo che i dati siano distribuiti in modo normale, il test t indica una media di 16,5 e un intervallo di confidenza, sempre per  a = 0.05, compreso tra 10,05 e 22,95; in questo caso è più breve di quello stimato con il T di Wilcoxon;

-          per valutare la simmetria della distribuzione dei dati e quindi la correttezza dell’uso del test parametrico, è possibile ricorrere al test di Lilliefors;

-          il test esatto sulla stima delle probabilità, come spiegato nel capitolo per un campione nel caso di misure ripetute, valuta che la probabilità di rifiutare valori inferiori a 9,5 in realtà non è esattamente 0.025 ma 0.0247 e che la probabilità di rifiutare valori superiori a 23,5 in realtà è 0,0222; di conseguenza, l’intervallo di confidenza calcolato ha probabilità esatta non di 0.950 ma

 1 – 0.0247 – 0.0222 = 0,9531

 ma pari a 0,9531.

L’effetto dei ties presenti nei dati è trascurabile.

 

 

ESEMPIO 3. (Con test T di Wilcoxon e confronto con il t di Student)

Dalla serie di 10 differenze già ordinate per rango

 

-8

-7

-3

-3

-2

-1

+1

+1

+1

+8

 

 

 si ricavano le 55 (10 x 11 / 2) medie accoppiate, riportate nella tabella successiva.

 

Nella descrizione dei risultati, Peter Armitage (professore emerito di Statistica Applicata, Università di Oxford) e Geoffry Berry (professore di Epidemiologia e Biostatsitica, Università di Sidney) commentano:

-          la stima di m è il valore mediano delle medie accoppiate, cioè –1 con questi dati (benché in molti testi sia chiamato intervallo di confidenza della mediana, i due autori usano il simbolo m per indicare il valore centrale)

-          per i limiti confidenza al 95%  e  con N = 10, il valore di T è 8;

-          escludendo le 8 medie accoppiate minori e le 8 maggiori, i valori limiti dell’intervallo di confidenza sono –4,5  e +1,0;

-          per un confronto, la distribuzione t fornisce limiti pari a –4,55 e +1,95; non sono troppo differenti dai valori qui calcolati (anzi, l’intervallo stimato con il t è maggiore).

 

 

 

-8

-7

-3

-3

-2

-1

+1

+1

+1

+8

-8

-8

-7,5

-5,5

-5,5

-5

-4,5

-3,5

-3,5

-3,5

0

-7

 

-7

-5

-5

-4,5

-4

-3

-3

-3

+0,5

-3

 

 

-3

-3

-2,5

-2

-1

-1

-1

+2,5

-3

 

 

 

-3

-2,5

-2

-1

-1

-1

+2,5

-2

 

 

 

 

-2

-1,5

-0,5

-0,5

-0,5

+3

-1

 

 

 

 

 

-1

0

0

0

+3,5

+1

 

 

 

 

 

 

+1

+1

+1

+4,5

+1

 

 

 

 

 

 

 

+1

+1

+4,5

+1

 

 

 

 

 

 

 

 

+1

+4,5

+8

 

 

 

 

 

 

 

 

 

+8

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007