TEST NON PARAMETRICI PER IL TREND

 

 

19.3.  TEST DI JONCKHEERE O JONCKHEERE-TERPSTRA PER ALTERNATIVE ORDINATE IN K CAMPIONI INDIPENDENTI

 

 

Nel caso di k campioni indipendenti, con dati disposti come nell’analisi della varianza ad un criterio di classificazione, quando si suppone che i gruppi siano ordinati secondo il valore delle loro mediane, con il test di Jonckheere è possibile verificare l'ipotesi se i vari campioni o gruppi abbiano tendenze centrali in accordo con la sequenza fissata a priori.

E’ chiamato anche test di Jonckheere-Terpstra o delle alternative ordinate (ordered alternatives), in quanto proposto quasi contemporaneamente ed in modo indipendente da T. J. Terpstra nel 1952 (nell’articolo The asymptotic normality and consistency of Kendall’s test against trend when ties are present in one ranking pubblicato su Indagationes Mathematicae Vol. 14, pp. 327-333) e da A. R. Jonckheere nel 1954 (con un articolo intitolato A distribution-free k-sample test against ordered alternatives pubblicato su Biometrika vol. 41, pp. 133-145). 

Del Department of Psychology, University College, London, A. R. Jonckheere introduce l’uso del suo test con questa presentazione. Un ricercatore, sulla base della sua esperienza o di una teoria, spesso è nella condizione di attendersi una serie ordinata (rank order) negli effetti di differenti trattamenti sperimentali. Si supponga, per esempio, di determinare gli effetti di differenti livelli di stress su test di abilità manuale, come il numero di errori commessi nelle quattro situazioni classificate di stress alto, medio, basso e minimo. Lo sperimentatore spera di dimostrare risultati significativamente differenti e che le persone con livello di stress più alto commettano effettivamente un numero di errori maggiore. Per una presentazione più analitica e per osservare l’uso di un linguaggio tecnicamente corretto nella introduzione di una pubblicazione scientifica che utilizzi il test, è utile leggere le parole dell’autore: The experimenter hopes to refute the hypothesis that the four samples of data could be considered as randomly drawn from the same population. However, experience or theory lead him to expect that the number of errors made increases with the degree of stress (his alternative hypothesis). Hence he desires a test of significance especially sensitive to those differences wich, while tending to reject the null hypothesis that the samples are all drawn from the same population, at the same time lends support to the specified alternative in question.

 

L’analisi della varianza (ANOVA) e il test non parametrico corrispondente (il test di Kruskall-Wallis) non permettono di rispondere a questa domanda: il loro risultato è indipendente dall’ordine con il quale sono disposte le medie dei trattamenti. In questo caso, invece, serve una combinazione tra

-          i concetti dell’analisi della varianza, con la quale condivide l’ipotesi nulla,

-          e i concetti della correlazione non parametrica tra ordine osservato e ordine atteso dei vari gruppi a confronto, con la quale condivide l’ipotesi alternativa.

Ma per il tipo di scala utilizzato, quale l’intensità dello stress, non è possibile utilizzare la forma classica di analisi della regressione.

Quando si dispone solamente di due gruppi è possibile effettuare test bilaterali e test unilaterali. Con più gruppi, l’analisi della varianza permette solo ipotesi alternative bilaterali; questo metodo offre l’opportunità di eseguire test con ipotesi alternativa unilaterale anche nel caso di più gruppi.

Ha ovvie applicazioni nello studio di serie temporali o spaziali: Suppose, for instance, that on each of n successive occasions, any one of k events may occur. Then we can test the hypothesis that the k events occur randomly in the series of n accasions, against the alternative that they tend to occur in a particular ordered time sequence.

 

In modo più formale, l'ipotesi nulla  è che le mediane (me) dei k gruppi a confronto siano uguali,

mentre l'ipotesi alternativa  è che esse siano allineate in base al valore, con un ordine fissato a priori,

-          che può essere il seguente

-          oppure quello in direzione opposta.

 

Se si rifiuta l'ipotesi nulla, secondo vari testi recenti tra cui quello di W. J. Conover del 1999 (Practical nonparametric statistics, 3rd ed. John Wiley & Sons, New York, VIII + 584 p.) e quello di P. Sprent e N. C. Smeeton del 2001 (Applied nonparametric statistical methods, 3rd ed. Chapman & Hall/CRC, London, XII + 461 p.) si accetta che tra i valori centrali dei gruppi a confronto esista almeno una ineguaglianza in senso stretto (where at least inequality is strict).

.

Jonckheere in realtà scrive

 e afferma che se si rifiuta l’ipotesi nulla l’ordine è in accordo con quanto ipotizzato nella H1.

 

Il test richiede che i campioni siano misurati con una scala ordinale o più precisa, come quelle di intervallo oppure di rapporti, in modo da non avere valori con lo stesso rango (ties). In realtà è accettato che ne sia presente un numero limitato.

 

Per una presentazione semplice dei dati e per facilitare l’interpretazione dei risultati, di norma i valori vengono disposti in una tabella identica a quella dell’analisi della varianza ad un solo criterio di classificazione:

 

 

 

Ma i k campioni a confronto sono disposti in ordine progressivo, in accordo con l’ipotesi alternativa formulata a priori sui valori delle mediane rispettive. E’ errato osservare nei dati raccolti una certa successione di medie e quindi collocare i gruppi in quell’ordine, utilizzando il test per valutarne la significatività. Aumenta molto la probabilità a di commettere un errore di Tipo I, cioè di trovare una differenza che in realtà non esiste.

 

Il test utilizza il metodo delle precedenze; è un procedimento lungo, quando si confrontano più gruppi, poiché analizza tutte le loro combinazioni semplici 2 a 2; con k gruppi sono k(k-1)/2.

Per ogni coppia di gruppi, si deve contare il numero di precedenze, ossia quante volte ogni osservazione dell'i-esimo gruppo precede le osservazioni del gruppo j-esimo, secondo il procedimento già proposto nel 1947 da Mann e Whitney con il test U., con il quale è concettualmente collegato, anche nella presentazione di Jonckheere.

Nel caso di due valori uguali (ties), il punteggio delle precedenze deve essere aumentato di 0,5.

 

L’applicazione del metodo a un esempio permette di fornire una spiegazione semplice e chiara.

Si supponga di dover analizzare 3 gruppi (A, B e C), composti rispettivamente 3, 4 e 3 osservazioni, come nella tabella sottostante,

 

1 - in cui, come primo passo, i valori devono essere ordinati in modo crescente entro ogni gruppo:

 

Gruppo  A

Gruppo  B

Gruppo  C

7,5

9,1

10,1

8,9

9,9

15,4

12,3

14,3

16,2

---

18,2

---

 

Con 3 gruppi (A, B, e C) i confronti possibili sono 3 (A-B,  A-C,  B-C). 

 

2 – Successivamente occorre riportare il numero di precedenze relativo ad ogni dato

 

 

A-B

A-C

B-C

 

4

3

3

 

4

3

3

 

2

2

2

 

---

---

0

Somme

10

8

8

 

 di un gruppo rispetto a tutti i dati del gruppo a confronto;

 nella tabella precedente,

-          il primo 4 del confronto A-B indica che il valore 7,5 del gruppo A precede nell’ordine naturale i 4 valori di B;

-          il valore 2 (terza posizione) del confronto A-B indica che il valore 12,3 del gruppo A precede nell’ordine naturale 2 valori di B (14,3 e 18,2);

-          mentre nel confronto B-C il quarto numero è 0, perché il valore 18,2 del gruppo B non precede nessun valore del gruppo C (essendo maggiore).

 

3 - Il terzo passo è la somma di tutte le precedenze, che fornisce la stima dell’indice J.

Con i dati dell’esempio, J risulta uguale a 26 (10 + 8 + 8).

 

4 - Quando è vera l’ipotesi nulla, il valore di J tende a essere uguale a un valore medio mJ, determinato

-          dal numero totale N  e

-          dal numero ni di dati

-          in ognuno dei k gruppi,

 secondo la relazione

mJ =  (N2 - )/4

 

Per piccoli campioni, la distribuzione campionaria di J è fornita da tabelle, riportate nelle 3 pagine seguenti.

Nella prima colonna delle tabelle è riportato il numero di dati che formano i k campioni a confronto. L’ordine delle loro dimensioni è ininfluente.

 

Per esempio, con 3 gruppi in cui il primo ha 6 osservazioni, il secondo 8 ed il terzo 6, si usa la terza riga della terza tabella, che riporta i valori di J per k uguali a 6, 6, 8. (cioè, rispettivamente per la varie probabilità, i seguenti valori critici:  85, 90, 99, 103).

Si rifiuta l’ipotesi nulla alla probabilità prefissata, quando il valore calcolato è uguale o superiore (³) a quello critico riportato nelle tabelle.

Ritornando ai dati dell’esempio con 3, 3 e 4 dati, il valore critico

-          alla probabilità a = 0.05 è 26

-          alla probabilità a = 0.01 è 29.

Il valore calcolato, uguale a 26, permette di rifiutare l’ipotesi nulla alla probabilità P £ 0.05.

In realtà la probabilità P è spesso inferiore a quanto indicato, poiché con pochi dati la distribuzione delle probabilità non varia in modo continuo: essa è calcolata mediante il calcolo combinatorio e il valore critico prescelto non è mai superiore al valore a prefissato.

 

Per campioni grandi, la distribuzione  asintotica di J è approssimativamente normale,

 con la media  già presentata

mJ =  (N2 - )/4

 e varianza  uguale a


 

Valori critici di J nel test di Jonckheere

per 3 gruppi con osservazioni da 3 a 8

(PRIMA PARTE)

 Dimensioni

a

del campione

0.10

0.05

0.01

0.005

3  3  3

20

22

24

25

3  3  4

24

26

29

30

3  3  5

28

30

33

35

3  3  6

32

34

38

40

3  3  7

36

38

42

44

3  3  8

40

42

47

49

3  4  4

29

31

34

36

3  4  5

33

35

39

41

3  4  6

38

40

44

46

3  4  7

42

45

49

52

3  4  8

47

50

55

57

3  5  5

38

41

45

47

3  5  6

43

46

51

53

3  5  7

48

51

57

59

3  5  8

53

57

63

65

3  6  6

49

52

57

60

3  6  7

54

58

64

67

3  6  8

60

64

70

73

3  7  7

61

64

71

74

3  7  8

67

71

78

81

3  8  8

74

78

86

89

 


Valori critici di J nel test di Jonckheere

per 3 gruppi con osservazioni da 4 a 8 e da 5 a 8

(SECONDA PARTE)

 Dimensioni

a

del campione

0.10

0.05

0.01

0.005

4  4  4

34

36

40

42

4  4  5

39

41

45

48

4  4  6

44

47

51

54

4  4  7

49

52

57

60

4  4  8

54

57

63

66

4  5  5

44

47

52

55

4  5  6

50

53

58

61

4  5  7

56

59

65

68

4  5  8

61

65

71

75

4  6  6

56

60

66

69

4  6  7

62

66

73

76

4  6  8

68

73

80

83

4  7  7

69

73

81

84

4  7  8

76

80

88

92

4  8  8

83

88

97

100

5  5  5

50

54

59

62

5  5  6

57

60

66

69

5  5  7

63

67

73

76

5  5  8

69

73

80

84

5  6  6

63

67

74

77

5  6  7

70

74

82

85

5  6  8

77

81

89

93

5  7  7

77

82

90

94

5  7  8

85

89

98

102

5  8  8

92

98

107

111


 

Valori critici di J nel test di Jonckheere

da 3 a 6 gruppi con  osservazioni da 2 a 5

(TERZA PARTE)

 Dimensioni

a

del campione

0.10

0.05

0.01

0.005

6  6  6 

71

75

82

86

6  6  7

78

82

91

94

6  6  8

85

90

99

103

6  7  7

86

91

100

103

6  7  8

94

99

109

113

6  8  8

102

108

118

122

7  7  7

94

99

109

113

7  7  8

102

108

119

123

7  8  8

111

117

129

133

8  8  8

121

127

139

144

2  2  2  2

18

19

21

22

2  2  2  2  2

28

30

33

34

2  2  2  2  2  2

40

43

46

49

3  3  3  3

37

39

43

45

3  3  3  3  3

58

62

68

70

3  3  3  3  3  3

85

89

97

101

4  4  4  4

63

66

72

76

4  4  4  4  4

100

105

115

119

4  4  4  4  4  4

146

153

166

171

5  5  5  5

95

100

109

113

5  5  5  5  5

152

159

173

178

5  5  5  5  5  5

223

233

251

258


 

dove

-  N  =  numero complessivo di dati raccolti

 =  numero di dati del j-esimo gruppo.

Poiché le alternative sono ordinate, come a lungo argomentato nella introduzione  il test è sempre a una coda.

 

Esempio 1  (per Grandi Campioni)

Si intende verificare se le aree più vicine ad un forno inceneritore hanno una ricaduta maggiore di polveri e di sostanze inquinanti, con un gradiente non necessariamente lineare ma monotonico, nonostante la variabilità nella direzione e nell’intensità dei venti. A questo scopo, è stata misurata la quantità di sostanze inquinanti ricadute in alcune aree e la loro distanza dalla sorgente di emissione.

L'area è stata suddivisa in 4 zone (A, B, C, D) concentriche, di raggio progressivamente maggiore passando dal gruppo A al gruppo D.

 

Per abbreviare e semplificare i calcoli,

-          i gruppi sono già stati ordinati secondo l’ordine crescente atteso per le quantità mediane, espresso nell’ipotesi H1

-           e i valori d’inquinamento raccolti in ogni zona sono già ordinati in ordine crescente entro ogni gruppo, come nella tabella seguente

 

 

ZONE

 

D

C

B

A

 

12

28

31

35

 

15

30

36

40

 

18

38

39

52

 

20

48

44

67

 

38

60

54

78

 

47

66

57

83

 

48

70

63

88

 

51

71

77

101

 

90

--

87

119

 

108

--

123

--

 

--

--

124

--

10

8

11

9

 

N = 38

 

 

Per i calcoli successivi, servono

-          i 4 valori di  (10, 8, 11, 9), corrispondenti al numero di osservazioni entro ogni gruppo e

-          il loro numero totale N = 38

 

Risposta.  Per verificare se la quantità di polveri ricadute è significativamente maggiore nelle aree presso la fonte d’emissione,

-  l'ipotesi nulla  è che all'aumento della distanza si abbia una quantità (q) mediana costante

H0qA = qB = qC = qD

-  mentre l'ipotesi alternativa  è che campioni raccolti in aree più distanti dall'inceneritore abbiano quantità (q) progressivamente minori di polveri, anche se non è quantificabile il tipo di relazione (lineare, quadratica, ecc. ...)

H1qD £ qC £ qB £ qA

Per verificare le caratteristiche della distribuzione dei dati e per la successiva interpretazione dei risultati, è sempre utile costruire il grafico con le singole osservazioni di ogni gruppo e la loro mediana.

 

 

 

 

In questo caso, passando dalla zona 1 alla 4 (cioè da D a A) si evidenzia una tendenza alla crescita, se l’attenzione viene posta solo sulle mediane. Ma se si prende in considerazione tutto il campo di variazione l’impressione è meno netta. Il test permette una conclusione oggettiva, analizzando l’informazione contenuta nell’insieme dei dati.

Si osserva inoltre una forte variabilità tra i gruppi, minima nel secondo, che non permetterebbe l’uso di tecniche parametriche.

 

La metodologia di Jonckheere richiede il calcolo delle precedenze, confrontando tutte le possibili coppie di zone campionate;  con 4 gruppi sono 6 

 D>C      D>B      D>A      C>B      C>A      B>A.

come riportate nella tabella sottostante

 

 

 

CALCOLO  DELLE  PRECEDENZE

 

D>C

D>B

D>A

C>B

C>A

B>A

 

8

11

9

11

9

9

 

8

11

9

11

9

8

 

8

11

9

9

8

8

 

8

11

9

7

7

7

 

5,5

9

8

5

6

6

 

5

7

7

4

6

6

 

4,5

7

7

4

5

6

 

4

7

7

4

5

5

 

0

2

2

--

--

3

 

0

2

1

--

--

0

 

--

--

--

--

--

0

51

78

68

55

55

58

 

 

Nella prima colonna, il confronto D>C riporta 4 volte il punteggio 8: infatti i primi 4 valori del gruppo D sono minori degli  8 valori del gruppo C. Il punteggio 5,5 deriva dal fatto che il valore 38 del gruppo D precede 5 valori del gruppo C (48, 60, 66, 70,71) ed è appaiato dal valore 38 del gruppo C.

Anche da questo approccio,

-          è evidente che i valori rilevati devono essere misurati in una scala continua per rendere minima la frequenza di dati appaiati;

-          nel caso di valori uguali, il punteggio aumenta di 0,5 dopo aver contato quanti dati sono superiori a quello di confronto.

Il valore di J è dato dalla somma di tutte le precedenze

 e risulta uguale a 365.

 

Se l'ipotesi nulla fosse vera, questo valore dovrebbe tendere alla media  

 

 

 che, con i dati del campione, risulta uguale a 269,5

 mentre la sua varianza  

 

 

 risulta uguale a 1469,9

 e quindi la deviazione standard   

 è uguale a 38,34.

Da questi dati deriva

 un valore di Z = 2,49.

Ricordando che nella distribuzione normale per un test unilaterale al valore di Z uguale a 2,49 corrisponde una probabilità P = 0.006, si rifiuta l'ipotesi nulla.

Di conseguenza, si accetta l'ipotesi alternativa: la tendenza centrale dei 4 gruppi è significativamente maggiore per le aree più vicine alla fonte d’inquinamento.

 

Il test di Jonckheere è utile soprattutto nel caso del confronto tra rapporti o percentuali, quando sono calcolati su dimensioni di campioni di dimensioni sensibilmente differenti. Con tali dati infatti non è possibile applicare i test parametrici, poiché i valori a confronto non hanno tutti la stessa attendibilità. La trasformazione delle percentuali mediante arcoseno (vedi paragrafo sulle trasformazioni) serve solamente per rendere omogenee le varianze di gruppi che hanno medie differenti; ma per test parametrici le percentuali a confronto debbono essere calcolate su totali simili, come già ripetutamente ricordato in vari esempi.

 

Esempio 2  (CampionE PICCOLO).

Nei test di tossicità cronica sono usate varie specie acquatiche, in particolare Ciprinidi, Salmoidi, Cladoceri e Ditteri. Gli animali vengono esposti a sostanze tossiche per tempi generalmente lunghi, al fine di consentire che siano sottoposti all'azione del principio attivo non solo gli adulti, ma anche gli stadi larvali e giovanili.

Tra le stime di tossicità, è frequente l’impiego

-          del rapporto tra il numero di individui sopravviventi sul totale degli immessi,

-          la percentuale di femmine che arrivano alla riproduzione,

-          la quota di uova che si schiudono.

Con una serie di esperimenti, è stato calcolato il numero di uova rimaste sterili su quelle deposte, per stimare l'effetto di una sostanza ritenuta tossica sulla loro schiusa.

 

dose

1

2

3

9/84

100/108

8/52

4/35

12/91

7/38

3/22

9/57

8/41

5/76

9/125

3/41

5/29

12/64

15/91

2/15

---

11/86

11/87

---

---

 

 

Si intende verificare se all'aumento della dose (1, 2, 3) si ha una quota crescente di uova sterili (misurate con x/y, dove x è il numero di uova sterili e y è il numero totale di uova deposte).

 

Risposta.  Per verificare l’ipotesi nulla

H0q1 = q2 = q3

mentre l'ipotesi alternativa  è

H1q1 £ q2 £ q3

 

1- la prima operazione consiste nel calcolare i rapporti e riportare i loro valori


 

dose

1

2

3

0,107

0,093

0,153

0,114

0,132

0,184

0,136

0,158

0,195

0,066

0,072

0,073

0,172

0,187

0,165

0,133

---

0,128

0,126

---

---

 

 

2 -  Successivamente si devono ordinare i valori entro ogni gruppo in modo crescente, per facilitare le operazioni di confronto tra i gruppi

 

dose

1

2

3

0,066

0,072

0,073

0,107

0,093

0,128

0,114

0,132

0,153

0,126

0,158

0,165

0,133

0,187

0,184

0,136

---

0,195

0,172

---

---

 

3 - Con 3 gruppi, si hanno 3 combinazioni di confronti a coppie:

1 contro (>) 2,

1 contro (>) 3,

2 contro (>) 3.

 

Per ognuna di esse si devono contare le precedenze, che sono riportate, insieme con la somma per colonna e il totale, nella tabella sottostante

 

 

1>2

1>3

2>3

 

5

6

6

 

3

5

5

 

3

5

4

 

3

5

3

 

2

4

1

 

2

4

--

 

1

2

--

Rj

19

31

19


 

4 -  Il valore di J, dato dalla somma di tutte le precedenze,

J = 19 + 31 + 19 = 69

 risulta uguale a 69.

Il valore di J tabulato per 3 gruppi con 5, 6 e 7 osservazioni alla probabilità a = 0.05 è 74.

Il valore di J calcolato (69) è inferiore a quello tabulato; di conseguenza, non si può rifiutare l'ipotesi nulla. All'aumentare della dose di sostanza inquinante, con questi dati non è dimostrato che si abbia un aumento significativo della proporzione di uova sterili.

 

In letteratura si trovano applicazioni del test di Jonckheere-Terpstra

-          a campioni estremamente piccoli,

-          con gruppi in cui compare addirittura una sola osservazione.

Soprattutto l’ultima è una condizione che vieta l’uso del test parametrico  F di Fisher.

 

ESEMPIO 3. (UN GRUPPO CON UN SOLO DATO) Una dimostrazione dell’uso del test con un solo dato in un gruppo è l’articolo pubblicato nel 1989 su Applied Statistics (vol. 38, pp. 495-506) di D. V. Hinkley (Modified profile likelihood in trasformed linear models) e riportato anche dal testo di P. Sprent del 1993 Applied Nonparametric Statistical Methods (2nd ed., Chapman & Hall, London) e nella edizione successiva scritta con N. C. Smeeton nel 2001.

 

Per valutare l’aumento delle rotture meccaniche alla crescita della velocità (20, 25, 30 35 miglia orarie), è presentata l’analisi dei seguenti dati, con solamente 10 osservazioni suddivise in 4 gruppi e dei quali uno con una sola osservazione.

 

Velocità (mph)

20

25

30

35

48

33

59

48

56

60

101

67

85

107

 

 

L’applicazione del test di Jonchkeere dimostra che con questi dati è possibile rifiutare l’ipotesi nulla al livello di significatività P =  0,0011. La probabilità è stata ricavata con una distribuzione esatta di permutazione dei ranghi, che è proposta nei pacchetti statistici di molti programmi informatici.

 

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007