TEST NON PARAMETRICI PER IL TREND

 

 

 19.5.  IL TEST DI PAGE O DELLE ALTERNATIVE ORDINATE IN K CAMPIONI DIPENDENTI

 

 

Il test di Page è simile al test di Jonckheere, ma serve quando le rilevazioni dei dati sono condotte in modo programmato, tale che i k gruppi a confronto abbiano osservazioni raccolte nelle stesse condizioni. Nell’analisi della varianza con la quale condivide l’ipotesi nulla

H0: me1 = me2 = … = mek

 è il caso di k campioni dipendenti o a blocchi randomizzati

I dati devono essere impostati in una tabella a doppia entrata:

 

 

 

T R A T T A M E N T I

 

 

B

L

O

C

C

H

I

1

2

3

---

I

---

N

 

 

Questo test, derivato da quello di Friedman già noto come distribution-free test for ordered alternatives based on Friedman rank sums, è stato proposto da Ellis Batten Page dell’Università del Connecticut nel 1963 con l’articolo Ordered hypotheses for multiple treatments: a significance test for linear ranks (pubblicato sulla rivista Journal of the American Statistical Association Vol. 58, pp. 216-230).

Il test di Page, come il test di Friedman, serve per verificare l'ipotesi nulla

 ma contro l’ipotesi alternativa unilaterale

o con un ordine delle mediane opposto.

Nel riassunto del suo articolo, Page scrive: A ranking statistic L is presented as test of a monotonic relationship among the treatment groups in the two-way analysis of variance.

Il test è solo unilaterale e quindi occorre definire a priori l’ordine o rango atteso dei valori delle mediane.

E’ quindi più potente del test di Friedman.

Accettare l'ipotesi alternativa  significa che esiste almeno una diseguaglianza (<) valida in senso stretto. La procedura è fondata sulla somma dei ranghi di ogni gruppo. La scala utilizzata per determinare i valori raccolti con il campione deve essere di tipo almeno ordinale.

Per proporre il metodo, evidenziando affinità e differenze con il test di Friedman, Page presenta la seguente tabella di un esperimento fittizio

 

 

K Trattamenti

 

N

Righe

A

B

C

D

 

1

2

3

4

Y

I

2

1

3

4

 

II

1

3

4

2

III

1

3

2

4

IV

1

4

2

3

V

3

1

2

4

VI

1

2

4

3

 =

 

9

 

14

 

17

 

20

 

=  60

=

 

9

 

28

 

51

 

80

 

=  168 = L

 

 

(In realtà Page indica con n il numero di trattamenti e con m il numero di righe; ma per utilizzare la stessa simbologia usata nei test precedenti, anche qui è usato k per il numero di trattamenti e N per quello delle righe)

Il test di significatività utilizza il c2. Tale verifica è stata introdotta nel 1937 da Milton Friedman con l’articolo The use of ranks to avoid the assumption of normality implicit in the analysis of variance (pubblicato su Journal of the American Statistical Association, Vol. 32 pp. 675-701) e sviluppata nel 1940 con l’articolo A comparison of alternative tests of significance for the test of m rankings (pubblicato su Annals of Mathematical Statistics, Vol. 11, pp. 86-92). Successivamente è stata esaminata da altri, tra i quali M. G. Kendall e B. B. Smith nel 1939 con l’articolo The problem of m rankings (pubblicato su Annals of Mathematical Statistics, Vol. 10, pp. 275-287).

La formula generale

 applicata ai ranghi diventa

 dove i gdl sono N – 1 e il valore atteso è

Con i dati dell’esempio riportato da Page

 dove

 

 si ottiene c2 = 6,60 con 3 gdl.

Il test non risulta significativo, poiché il valore critico alla probabilità a = 0.05 è = 7,82.

In questo caso, il test di Friedman non permette di rifiutare l’ipotesi nulla.

Ellis Batten Page propone la statistica

 dove Yj è il rango della colonna.

Con i dati dell’esempio

 si ottiene L = 168

I valori critici sono forniti direttamente dalla Page nell’articolo citato. Essi  sono riportati nelle tabelle seguenti, con variazioni che riguardano solo la impostazione grafica.

 

Nel caso di piccoli campioni, la significatività di L è fornita solo dalle tabelle.

L’entrata è determinata

-          dal numero di colonne o gruppi (k) e

-          dal numero di dati (N) in ogni colonna.

Con i dati dell’esempio,

 in cui  k = 4  e  N = 6,

 la tabella dei valori critici alla probabilità

-          a = 0.05 riporta un valore uguale a 163

-          a = 0.01 riporta un valore uguale a 167

-          a = 0.001 riporta un valore uguale a 172

Avendo calcolato L = 168 nel caso dell’esempio precedente è possibile rifiutare l’ipotesi nulla con probabilità P < 0.01. E’ da evidenziare che con il test di Friedman non si rifiutava l’ipotesi nulla nemmeno alla probabilità a = 0.05.

 

Nel caso di grandi campioni, la statistica L si distribuisce in modo approssimativamente normale

 dove, in tabelle a doppia entrata di

-          k trattamenti o colonne ,

-          N righe o osservazioni per colonna,

 la media attesa  è

 e  è


Valori critici di L proposti da Page

(Sono significativi i valori uguali o maggiori di quelli riportati alle probabilità prefissate)

I valori per campioni piccoli, riportati entro caselle sono basati su distribuzioni esatte.

I valori per campioni grandi, riportati senza casella, sono basati su approssimazioni alla normale

 

 

 

K = 3

 

K = 4

 

K = 5

 

 

a

 

a

 

a

N

 

0.05

0.01

0.001

 

0.05

0.01

0.001

 

0.05

0.01

0.001

2

 

28

---

---

 

58

60

---

 

103

106

109

3

 

41

42

---

 

84

87

89

 

150

155

160

4

 

54

55

56

 

111

114

117

 

197

204

210

5

 

66

68

70

 

137

141

145

 

244

251

259

6

 

79

81

83

 

163

167

172

 

291

299

307

7

 

91

93

96

 

189

193

198

 

338

346

355

8

 

104

106

109

 

214

220

225

 

384

393

403

9

 

116

119

121

 

240

246

252

 

431

441

451

10

 

128

131

134

 

266

272

278

 

477

487

499

11

 

141

144

147

 

292

298

305

 

523

534

546

12

 

153

156

160

 

317

324

331

 

570

581

593

13

 

165

169

172

 

343

350

358

 

615

628

642

14

 

178

181

185

 

368

376

384

 

661

674

689

15

 

190

194

197

 

394

402

410

 

707

721

736

16

 

202

206

210

 

420

427

436

 

754

767

783

17

 

215

218

223

 

445

453

463

 

800

814

830

18

 

227

231

235

 

471

479

489

 

846

860

876

19

 

239

243

248

 

496

505

515

 

891

906

923

20

 

251

256

260

 

522

531

541

 

937

953

970

(continua)


Valori critici di L proposti da Page

(Sono significativi i valori uguali o maggiori di quelli riportati alle probabilità prefissate)

I valori per campioni piccoli, riportati entro caselle sono basati su distribuzioni esatte.

I valori per campioni grandi, riportati senza casella, sono basati su approssimazioni alla normale

 

 

 

K = 6

 

K = 7

 

K = 8

 

 

a

 

a

 

a

N

 

0.05

0.01

0.001

 

0.05

0.01

0.001

 

0.05

0.01

0.001

2

 

166

173

178

 

252

261

269

 

362

376

388

3

 

244

252

260

 

370

382

394

 

532

549

567

4

 

321

331

341

 

487

501

516

 

701

722

743

5

 

397

409

420

 

603

620

637

 

869

893

917

6

 

474

486

499

 

719

737

757

 

1037

1063

1090

7

 

550

563

577

 

835

855

876

 

1204

1232

1262

8

 

625

640

655

 

950

972

994

 

1371

1401

1433

9

 

701

717

733

 

1065

1088

1113

 

1537

1569

1603

10

 

777

793

811

 

1180

1205

1230

 

1703

1736

1773

11

 

852

869

888

 

1295

1321

1348

 

1868

1905

1943

12

 

928

946

965

 

1410

1437

1465

 

2035

2072

2112

13

 

1003

1022

1044

 

1525

1553

1585

 

2201

2240

2285

14

 

1078

1098

1121

 

1639

1668

1702

 

2367

2407

2453

15

 

1153

1174

1197

 

1754

1784

1818

 

2532

2574

2622

16

 

1228

1249

1274

 

1868

1899

1935

 

2697

2740

2790

17

 

1303

1325

1350

 

1982

2014

2051

 

2862

2907

2958

18

 

1378

1401

1427

 

2097

2130

2167

 

3028

3073

3126

19

 

1453

1476

1503

 

2217

2245

2283

 

3193

3240

3294

20

 

1528

1552

1579

 

2325

2360

2399

 

3358

3406

3461

(continua)


Valori critici di L proposti da Page

(Sono significativi i valori uguali o maggiori di quelli riportati alle probabilità prefissate)

I valori per campioni piccoli, riportati entro caselle sono basati su distribuzioni esatte.

I valori per campioni grandi, riportati senza casella, sono basati su approssimazioni alla normale

 

 

 

K = 9

 

K = 10

 

 

a

 

a

N

 

0.05

0.01

0.001

 

0.05

0.01

0.001

2

 

500

520

544

 

670

696

726

3

 

736

761

790

 

987

1019

1056

4

 

971

999

1032

 

1301

1339

1382

5

 

1204

1236

1273

 

1614

1656

1704

6

 

1436

1472

1512

 

1927

1972

2025

7

 

1668

1706

1750

 

2238

2288

2344

8

 

1900

1940

1987

 

2549

2602

2662

9

 

2131

2174

2223

 

2859

2915

2980

10

 

2361

2407

2459

 

3169

3228

3296

11

 

2592

2639

2694

 

3478

3541

3612

12

 

2822

2872

2929

 

3788

3852

3927

13

 

3052

3104

3163

 

4097

4164

4241

14

 

3281

3335

3397

 

4405

4475

4556

15

 

3511

3567

3631

 

4714

4786

4869

16

 

3741

3798

3864

 

5022

5097

5183

17

 

3970

4029

4098

 

5330

5407

5496

18

 

4199

4260

4330

 

5638

5717

5808

19

 

4428

4491

4563

 

5946

6027

6121

20

 

4657

4722

4796

 

6253

6337

6433


 

Sostituendo in

 e semplificando,

 si ottiene la formula abbreviata

 

 

che permette un calcolo più rapido e semplice del valore di Z.

Poiché il test di Page è a una coda, i valori critici fondamentali sono:

-          Z = 1,645 alla probabilità a = 0.05

-          Z = 2,328 alla probabilità a = 0.01

-          Z = 3,09 alla probabilità a = 0.001

 

Nelle precedenti tabelle dei valori critici, entro le caselle sono riportati i valori stimati con il metodo esatto, valido per campioni piccoli. Nella zone senza le caselle, sono riportati i valori ricavati con la distribuzione normale, valida per grandi campioni. Pubblicati dalla Page fino a campioni di dimensioni k = 10 e N = 50, questi valori permettono di verificare la significatività di L senza l’uso della normale. Il ricorso alla distribuzione Z unilaterale ha lo svantaggio di richiedere calcoli molto più lunghi, per passare da L a Z, ma il vantaggio di determinare probabilità P più precise.

 

Per spiegare la metodologia in modo ancora più semplice e illustrare altri concetti importanti nell’applicazione del test, è utile sviluppare un esempio in tutti i suoi passaggi logici e metodologici.

 

ESEMPIO 1.  Si supponga di voler sperimentare gli effetti di una sostanza tossica sulla crescita di una specie vegetale. A questo scopo, sono stati collocati i semi

-          in 5 colture con concentrazione crescente (36, 54, 72, 108, 144) del principio attivo e

-          il test è stato ripetuto da 3 ricercatori (A, B, C).

Nella tabella sottostante sono riportati i valori medi delle 4 repliche fatte da ogni ricercatore per ogni concentrazione (l’uso di valori medi vieta l’uso della statistica parametrica):


 

 

CONCENTRAZIONE (g/l)

 

Ricercatore

36

54

72

108

144

A

7,63

8,14

7,76

7,17

7,46

B

8,00

8,15

7,73

7,57

7,68

C

7,93

7,87

7,74

7,80

7,21

 

 

E’ possibile affermare che l’aumento della concentrazione della sostanza tossica (da 36 a 144) inibisce la crescita della specie?

 

Risposta. La metodologia inferenziale del test di Page richiede alcuni passaggi.

 

1 – Dapprima  si deve formulare l’ipotesi nulla

H0: me36 = me54 = me72 = me108 = me104

 secondo la quale le mediana della crescita alle 5 diverse concentrazioni sono uguali

 e l’ipotesi alternativa unilaterale

H1: me144 £ me108 £ me72 £ me54 £ me36

 secondo la quale la crescita della specie aumenta con il diminuire della concentrazione.

 

2 – L’ipotesi alternativa definisce l’ordine con il quale devono essere riportati i dati nella tabella.

Con i dati dell’esempio, è necessario invertire l’ordine delle colonne (i trattamenti a confronto), che pertanto diventa

 

 

CONCENTRAZIONE (g/l)

Ricercatore

144

108

72

54

36

A

7,46

7,17

7,76

8,14

7,63

B

7,68

7,57

7,73

8,15

8,00

C

7,21

7,80

7,74

7,87

7,93

 

 

3 – Come nel test di Friedman, i valori devono essere trasformati nel loro rango, entro la stessa riga. Si assegna quindi il rango minore (1) al punteggio più basso e si aumenta di 1 per ogni punteggio successivo della stessa riga fino a k, uguale al numero di trattamenti o gruppi a confronto. Nel caso di due o più valori uguali entro la stessa riga, secondo la procedura abituale, il punteggio viene calcolato sulla media dei loro ranghi.

 

Con i dati dell’esempio, la trasformazione dei valori in ranghi delle tre prime righe e la loro somma, riportata nella quarta riga, diventa

 

 

CONCENTRAZIONE (g/l)

Ricercatore

144

108

72

54

36

A

2

1

4

5

3

B

2

1

3

5

4

C

1

3

2

4

5

5

5

9

14

12

 

 

4 - Il test utilizza i totali dei ranghi, effettuati per colonna.

Se è vera l'ipotesi nulla H0, i punteggi saranno distribuiti a caso entro la stessa riga e pertanto le somme dei ranghi (Rj) per colonna tenderanno ad essere uguali. Questi valori dipenderanno dal numero N di dati presenti in ogni colonna.

 

5 - Nel test di Page, dalla somma degli  si ricava  L, definita come la somma dei ranghi di ogni colonna, moltiplicata per la  posizione attribuita alla colonna, come nella formula seguente

 

 

Con i dati dell’esempio

L   =   1 x 5  +  2 x 5  +  3 x 9  +  4 x 14  +  5 x 12   =   5 + 10 + 27 + 56 + 60   =   158

 L risulta uguale a 158.

 

6 - Nel caso di piccoli campioni, la significatività di L è fornita dalle tabelle.

L’entrata è determinata

-          dal numero di colonne o gruppi (k) e

-          dal numero di dati (N) in ogni colonna.

Con i dati dell’esempio,

 in cui  k = 5  e  N = 3,

 la tabella dei valori critici alla probabilità

-          a = 0.05 riporta un valore uguale a 150

-          a = 0.01 riporta un valore uguale a 155

-          a = 0.001 riporta un valore uguale a 160

Poiché il valore calcolato è L = 158, si rifiuta l’ipotesi nulla con probabilità P < 0.01.

E’ importante osservare come l’affermazione riguardi il trend generale, cioè la diminuzione dei valori medi di crescita nel loro complesso, non tutti i risultati dei trattamenti; infatti la crescita media è stata maggiore con dose 54 rispetto a dose 36.

 

TIES. I dati dovrebbero essere misurati su una scala continua, per cui non dovrebbero esistere valori con lo stesso rango. Page non ha proposto correzioni per i ties, affermando che la scala deve essere continua. Tuttavia un numero molto limitato di valori sono accettabili, poiché non alterano sensibilmente il risultato e forniscono una risposta più cautelativa. In altri termini l’errore che si commette con i ties rende il test meno significativo

 

Nel caso di 2 soli gruppi (k = 2), l’alternativa al test di Page è il test U di Mann-Whitney per 2 campioni dipendenti, nell’ipotesi unidirezionale (Infatti verifica la direzione della tendenza centrale con due gruppi).

 

Nelle situazioni in cui i trattamenti hanno un ordine naturale, il test di Page è preferibile a quello di Friedman, che risponde solo alla domanda se le mediane dei vari trattamenti sono differenti.

Una volta che sia stata rifiutata l’ipotesi nulla, per ottenere una informazione più completa sulla serie delle mediane, è possibile verificare tra quali esista una differenza significativa, ricorrendo ai confronti multipli basati sulla somma dei ranghi di Friedman.

 

 

Esempio 2 (per Grandi Campioni). Lungo il corso d'acqua che attraversa una città, sono state collocate 6 stazioni (A, B, C, D, E, F) di rilevazione dell'inquinamento. In ognuna delle 6 stazioni, per 15 giorni è stata fatta una misura del carico inquinante. 

I valori campionati, classificati per stazione e per giorno di rilevazione, sono riportati nella tabella a due entrate:

 

 

 

STAZIONI

GIORNI

A

B

C

D

E

F

1

20

18

24

22

29

38

2

32

37

34

31

39

38

3

18

23

19

25

23

26

4

9

7

14

11

12

11

5

29

37

32

59

40

45

6

38

25

27

47

45

45

7

8

15

7

12

15

13

8

18

13

22

26

23

22

9

32

36

37

35

48

40

10

23

25

26

25

32

56

11

6

8

12

9

10

10

12

24

18

20

27

25

27

13

13

18

14

14

19

26

14

18

26

19

19

29

32

15

14

12

25

56

54

75

 

 

Si intende verificare se, con l’accumulo degli scarichi urbani, lungo il percorso (dalla stazione A alla F) si ha un aumento significativo del carico inquinante.

 

Risposta.

1 - Dapprima si devono definire l'ipotesi nulla

 

 e l'ipotesi alternativa

 intendendo con essa che tra valore iniziale e valore finale c’è almeno una discontinuità significativa.

 

2 - Successivamente, poiché i trattamenti sono già nell’ordine naturale, si devono trasformare i valori in ranghi, considerando in modo indipendente ogni riga, come nella tabella sottostante:


 

 

STAZIONI

GIORNI

A

B

C

D

E

F

1

2

1

4

3

5

6

2

2

4

3

1

6

5

3

1

3,5

2

5

3,5

6

4

2

1

6

3,5

5

3,5

5

1

3

2

6

4

5

6

3

1

2

6

4,5

4,5

7

2

5,5

1

3

5,5

4

8

2

1

3,5

6

5

3,5

9

1

3

4

2

6

5

10

1

2,5

4

2,5

5

6

11

1

2

6

3

4,5

4,5

12

3

1

2

5,5

4

5,5

13

1

4

2,5

2,5

5

6

14

1

4

2,5

2,5

5

6

15

2

1

3

5

4

6

Rj

25,0

37,5

47,5

56,5

71,5

82,5

 

 

3 - Successivamente, si calcolano le somme dei ranghi per colonna (Rj), come nell’ultima riga della tabella precedente.

 

4 - Dalla somma dei ranghi per colonna (Rj) si ottiene il valore di L

 

 che risulta uguale a 1321.

 5 - Per valutare la sua significatività, si stima il valore di  

 

 

 che risulta uguale a 7,20.

Il valore di ottenuto  è particolarmente elevato, superiore a quelli riportati nelle tabella della distribuzione normale unilaterale: corrisponde ad una probabilità P di circa 1 su un milione.

Pertanto, si rifiuta l'ipotesi nulla e si accetta l'ipotesi alternativa: dalla stazione A alla stazione F si ha un aumento altamente significativo del carico inquinante, anche se non è possibile dire nulla sulla curva di crescita.

Nella tabella dei valori critici, con k = 6 e N = 15 alla probabilità a = 0.001 è riportato L = 1197. Permette di rifiutare l’ipotesi nulla con probabilità P < 0.001 quindi con una stima molto meno precisa.

Infine l’eventuale ricorso ai confronti multipli con il test di Friedman permette di verificare tra quali stazioni esiste una differenza significativa.

 

Esempio 3  (per Piccoli Campioni). In un centro urbano sono stati attivati 5 punti di osservazione (a, b, c, d, e) per rilevare l'inquinamento dovuto al traffico e per ogni zona sono state effettuate 4 osservazioni, a distanza di 4 ore ognuna, dalle ore 6 alle ore 18.

Per esporre alla cittadinanza la situazione dell’inquinamento atmosferico in modo chiaro e sintetico, l’ufficio comunale ha fornito le misure su una scala ordinale, con giudizi della qualità dell'aria riportati in modo simbolico,

--          pessima

-     insufficiente

=        sufficiente

+              buona

++           ottima

 come nella tabella sottostante

 

 

ORE

STAZIONE

6

10

14

18

A

-

--

+

=

B

--

=

-

=

C

-

=

+

+

D

=

+

=

++

E

-

+

=

+

 

 

Si vuole verificare se, nel corso di una giornata con blocco del traffico, dal mattino alla sera vi è stata una diminuzione nei tassi d'inquinamento.

 

Risposta.  I dati devono essere

-          trasformati in ranghi entro la stessa riga e

-          sommati per colonna (Rj),


 

 

ORE

STAZIONE

6

10

14

18

A

2

1

4

3

B

1

3,5

2

3,5

C

1

2

3,5

3,5

D

1,5

3

1,5

4

E

1

3,5

3

3,5

Rj

6,5

13,0

14,0

17,5

 

 al fine di calcolare il valore di L

L = 1x6,5 + 2x13 + 3x14 + 4x17,5 = 144,5

 che risulta uguale a 144,5.

 

Per k = 4  e  N = 5,

 la tabella sinottica dei valori critici della L di Page riporta

- alla probabilità a = 0.05 il valore 137

- alla probabilità a = 0.01 il valore 141

- alla probabilità a = 0.001 il valore 145.

Il valore di L calcolato (144,5) è  compreso tra quello relativo alla probabilità a = 0.01 e quello alla probabilità a = 0.001.

Di conseguenza, si rifiuta l'ipotesi nulla con probabilità P < 0.01 di commettere un errore di I tipo.

Si accetta l'ipotesi alternativa: nel complesso delle stazioni esiste un miglioramento delle condizioni dell'aria al trascorrere delle ore (dalle 6 alle 18), durante la giornata di blocco del traffico.

 

 

ESEMPIO 4  (CONFRONTI TRA L E Z).  E’ ovvio che, quando il campione non è troppo piccolo, in tutti i test non parametrici esista corrispondenza tra le probabilità indicate dai valori critici riportate nelle tabelle sinottiche e quelle stimate con la distribuzione normale.

E’ una relazione che spesso sfugge allo studente e al ricercatore, che non abbiano acquisito sufficiente familiarità con la statistica. A questo scopo, è didatticamente utile l’esercizio di valutare le probabilità corrispondenti ai valori critici.

 

Per il test di Page dalla tabella dei valori critici ricaviamo che

 per k uguale a 10 ed N uguale a 12,

-          alla probabilità a = 0.05 il valore critico è L = 3788,

-          alla probabilità a = 0.01 è L = 3852,

-          alla probabilità a =  0.001 è L = 3927.

Poiché (con k uguale a 10 ed N uguale a 12) il campione è di dimensioni relativamente grandi, le probabilità calcolate con la distribuzione normale, ovviamente solo in una coda come richiede il test, dovrebbero essere molto simili.

 

Infatti la formula generale

per N = 12   e   k = 10 diventa

Z =

 

 nella quale l’unico valore da inserire è L, fornito dalle tabelle.

 

Per la probabilità a = 0.05 il valore critico  di L è 3788; 

 con esso, il risultato di Z diviene

 

Z =   =    =

 

 uguale a 1,66. 

Nella tabella dei valori critici in una coda della distribuzione normale, a Z = 1,66 corrisponde la probabilità a =  0.0485. E’ un valore molto vicino a 0.05 indicato per la significatività di L.

 

Per la probabilità a = 0.01 a L si sostituisce il valore critico di 3852;

  il risultato di Z diviene

 

Z  =    =    = 

 

 uguale a 2,33 al quale, in una coda della distribuzione, corrisponde la probabilità a = 0.099.

 

Per la probabilità a = 0.001 a L si sostituisce il valore critico di 3927;

 il risultato di Z diviene

 

Z =   =    =

 

uguale a 3,11 al quale corrisponde la probabilità a = 0.00099.

Con la distribuzione normale, i valori critici hanno fornito probabilità molto vicine, quasi coincidenti, con quelle riportate nella tabella.

E’ una dimostrazione empirica del fatto che, in assenza dei valori critici, il ricorso alla distribuzione normale fornisce risposte attendibili, se i campioni non sono eccessivamente piccoli.

Per campioni di dimensioni maggiori, la coincidenza è perfetta, a meno delle approssimazioni introdotte nei calcoli. Infatti la Page stima i valori critici di L fino a N = 50 e k = 10 utilizzando i valori critici di Z. Ad esempio per a = 0.01 suggerisce la misura approssimata Z = 2,33.

 

Per valutare la significatività di L in grandi campioni, Page suggerisce

 

 

 che è distribuito approssimativamente come un chi-quadrato con 1 grado di libertà.

Ma il chi-quadrato serve per test bilaterali, mentre il test di Page è unilaterale: di conseguenza la probabilità stimata con il chi-quadrato deve essere dimezzata.

 is distributed approximately as chi-square with 1 degree of freedom. The ordinary use of tables would be equivalent to a two-sided test of agreement. If a one-sided test is desired, as will almost always be the case, the probability discovered in the chi-square table should be halved.

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007