METODI NON PARAMETRICI PER UN CAMPIONE

 

 

 

7.15.   IL METODO DI  KOLMOGOROV-SMIRNOV PER UN CAMPIONE, CON DATI ORDINALI DISCRETI E CON DATI CONTINUI

 

 

Come ripetutamente evidenziato nel capitolo sul c2 parlando delle condizioni di validità, quando il numero totale di osservazioni è ridotto, convenzionalmente inferiore a 30, e/o le frequenze attese di almeno due gruppi sono inferiori a 5, non è possibile utilizzare il test .

E’ tuttavia ugualmente possibile verificare la concordanza tra fatto ed ipotesi, cioè tra una distribuzione osservata e la corrispondente attesa, ricorrendo al test per un campione di Kolmogorov-Smirnov, due matematici russi quasi coetanei, Andrei Nikolaevich Kolmogorov (1903-1987) e Nikolai Vasil’evich Smirnov (1900-1966).

 

Soprattutto, come verrà evidenziato ulteriormente con una dimostrazione sperimentale semplice, il test è più potente di quello del  , in particolare quando si utilizza una scala continua. Il test non è limitato al caso di piccoli campioni, ma è estensibile anche a grandi campioni, sebbene all’aumentare del numero dei dati diminuisca il suo vantaggio in potenza sui corrispondenti test c2  e  test G; oltre i 100 dati, la differenza è minima.

 

Proposto da A. Kolmogorov nel 1933 per il confronto tra un campione ed una distribuzione teorica (con l’articolo in italiano Sulla determinazione empirica di una legge di distribuzione, sulla rivista Giornale dell’Istituto Italiano degli Attuari Vol. 4 pp. 1-11) di solito rettangolare o uniforme, è stato sviluppato e poi esteso al caso di due campioni indipendenti nel 1939 da N. V. Smirnov con due articoli (il primo in francese, Sur les écarts de la courbe de distribution empirique, pubblicato su Recueil Mathématiques N. S. 6:, pp. 3-26; il secondo in russo ma divulgato successivamente in inglese, On the estimation of the discrepancy between empirical curves of distribution for two independent samples, pubblicato su Bull. Moscow Univ. Intern. Ser. (Math) Vol. 2, pp.3-16).

 

Nel 1948 Smirnov ha fornito una tabella dei valori critici (con l’articolo in inglese Table for estimating the goodness of fit of empirical distribution, pubblicato su Ann. Math Stat. vol. 19, pp. 279-281).

Successivamente, anche in tempi recenti, sono state proposte diverse altre tabelle; tra esse si distinguono per completezza dei parametri considerati quelle di A. N. Pettitt e M. A. Stephens del 1977 per dati raggruppati (The Kolmogorov-Smirnov goodness-of-fit statistic with discrete and grouped data. Technometrics Vol 19, pp. 205–210) e le proposte di H. J. Khamis del 1990 per dati continui (The d corrected Kolmogorov-Smirnov test for goodnes of fit, pubblicato su Journal Statist. Plan. Infer. Vol. 24, pp. 317- 335).

Tuttavia, su vari testi di statistica applicata spesso sono utilizzate quelle proposte inizialmente. Sono più semplici anche se più approssimate.

 

In queste dispense sono riportate quelle proposte da L. H. Miller nel 1956 (con l’articolo Table of pencentage points of Kolmogorov statistics, pubblicato su Journal of the American Statistical Association Vol. 51, pp. 111 – 121). Proposte per una scala continua, sono utilizzate in vari testi di statistica applicata anche per dati raggruppati, a motivo della buona approssimazione che esse forniscono.

 

Il test di Kolmogorov-Smirnov per la bontà dell’adattamento (Kolmogorov-Smirnov goodness of fit test), per la sua ampia utilizzazione è proposto su molti testi di statistica applicata. Esso può essere utilizzato

-  sia per dati misurati su una scala ordinale discreta o dati continui raggruppati in classi,

-  sia per dati continui, che possono essere misurati con una scala di rapporti oppure a intervalli oppure ordinale.


 

PER DATI DISCRETI O RAGGRUPPATI

Tra i testi internazionali, questo metodo è riportato in

-  Siegel Sidney e N. John jr. Castellan del 1988 (Nonparametric Statistics for the Behavioral Sciences, (McGraw-Hill, London), tradotto in italiano nel 1992 Statistica non parametrica 2° ed., McGraw-Hill Libri Italia, Milano, 472 pp.)

-  Zar Jerrold H. del 1999 (Biostatistical Analysis, fourth ed., Prentice Hall, Englewood Cliffs, New Jersey, USA, pp.663 + 203 app.)

A essi si rinvia per ulteriori approfondimenti e per l’uso di tabelle dei valori critici che sono più estese di quelle riportate in queste dispense.

 

In questo test, si richiede una condizione aggiuntiva, rispetto al test chi quadrato: i gruppi non possono essere qualitativi, ma devono essere ordinati secondo una scala di tipo almeno ordinale.

L’ipotesi nulla è ancora

H0: la distribuzione osservata e quella attesa sono uguali

 

 contro l’ipotesi alternativa

H1: le due distribuzioni divergono,

 senza per questa indicare quale possa essere la distribuzione teorica più vicina alla distribuzione osservata.

 

Il confronto viene realizzato mediante il valore di massima divergenza tra le due distribuzioni cumulate. Successivamente, la tabella dei valori critici indica la probabilità di trovare una divergenza pari o superiore a quella calcolata, qualora fosse vera l’ipotesi nulla.

Il test si fonda sulla logica che, se un campione fosse estratto da una determinata distribuzione teorica o attesa, la sommatoria della distribuzione osservata dovrebbe discostarsi dalla sommatoria della distribuzione attesa solo per fattori casuali, di piccola entità.

 

Indicando con

-  O(Xi) ogni valore della sommatoria dei dati osservati e con

-  A(Xi) ogni valore della sommatoria dei dati attesi, 

 la deviazione massima D’ è

D’ = max | O(Xi) - A(Xi)|

 

Per l’uso delle tabelle, come la prossima riportata, alcuni testi propongono di rendere D’ indipendente dal numero di osservazioni mediante la trasformazione

D = D’ / N

benché la sua significatività dipenda dalla dimensione (N) del campione.

 

La tavola presenta i valori critici per un test a 2 code e a 1 coda, in rapporto alla dimensione (N) del campione e al livello di significatività a prefissata.

 

Ad esempio, per apprenderne l’uso, alla probabilità a = 0.05 bilaterale

- con 5 dati (N = 5) è significativa una differenza uguale o superiore (D ³ ) a 0,563

- con 6 dati è significativa una differenza di 0,519

- con 7 dati una differenza di 0,483, ecc. 

Alla probabilità a = 0.01 per un test unilaterale sono rispettivamente significativi valori di D uguali o superiori

- a 0,627 (per N = 5)

- a 0,577 (per N = 6)

- a 0,538 (per N = 7).

 

La tavola riporta i valori critici fino ad N uguale a 40.

Con N maggiore di 40, per test bilaterali sono significativi

- alla probabilità a = 0.05 valori di

D ³ 1,36 /

- alla probabilità a = 0.01 valori di

D ³ 1,63 /

 

Con N maggiore di 40, per test unilaterali sono significativi

- alla probabilità a = 0.05 valori di

D ³ 1,22 /

- alla probabilità a = 0.01 valori di

D ³ 1,52 /

 

Il ricorso al test di Kolmogorov-Smirnov permette di formare un numero molto alto di gruppi, ognuno con poche osservazioni attese, mentre il test chi-quadrato impone un loro raggruppamento, per non avere frequenze attese inferiori a 5.

 

Il test di Kolmogorov-Smirnov è più potente del test c2( g. d. l. ), in particolare quando il campione non è grande.

Quando la numerosità del campione è grande, i due test hanno potenza simile e forniscono probabilità simili.

 

Per illustrane l’applicazione in modo semplice, è utile seguire un esempio in tutti i suoi passaggi logici, dalla presentazione del problema scientifico alla risposta conclusiva.

 

1) Si assuma che in dieci ore di osservazione, dalle ore 7 alle 17, un ricercatore di etologia abbia avvistato 15 uccelli della stessa specie dal suo luogo di appostamento, con la seguente cadenza oraria:

 

 

Ore

7-8

9-10

11-12

13-14

15-16

Uccelli avvistati

0

1

1

9

4

 

 

Egli intende verificare se

-  si tratta di una distribuzione approssimativamente uniforme, cioè se le differenze osservate rispetto a tale ipotesi possono essere considerate entro i limiti delle variazioni accidentali (H0),

-  oppure se sia più attendibile pensare ad una incidenza effettiva dell’ora sul numero di avvistamenti (H1) e quindi se le frequenze nelle diverse fasce orarie seguono una legge diversa (non nota, ma differente da quella di uniformità).

 

2 – La prima operazione da effettuare è la stima della distribuzione attesa, nella condizione che l’ipotesi nulla sia vera.

Se l’ora non incidesse sulla frequenza di volo degli uccelli, il ricercatore avrebbe dovuto avvistarne un numero costante per ogni intervallo unitario di tempo; con 15 uccelli osservati in 5 intervalli di tempo, il ricercatore avrebbe dovuto osservarne 3 ogni 2 ore, con la seguente cadenza

 

 

Ore

7-8

9-10

11-12

13-14

15-16

Distribuzione attesa

3

3

3

3

3

 

 

Il confronto a coppie tra le due distribuzioni cumulate permette di calcolare le differenze tra coppie di frequenze e di trovare facilmente la differenza assoluta massima:

 


 

 

Valori critici di Dmax nel test di Kolmogorov-Smirnov

per la bontà dell’adattamento con dati continui e raggruppamenti in classi

Test unilaterali e test bilaterali

con N da 5 a 24

(Proposti da Miller, 1956)

 

 

 

Dimensione del campione

Test Unilaterale

Test Bilaterale

N

a = 0.05

a = 0.01

a = 0.05

a = 0.01

5

0,509

0,627

0,563

0,669

6

0,468

0,577

0,519

0,617

7

0,436

0,538

0,483

0,576

8

0,410

0,507

0,454

0,542

9

0,388

0,480

0,430

0,513

10

0,369

0,457

0,409

0,489

11

0,352

0,437

0,391

0,468

12

0,338

0,419

0,375

0,449

13

0,326

0,404

0,361

0,433

14

0,314

0,390

0,349

0,418

15

0,304

0,377

0,338

0,404

16

0,295

0,366

0,327

0,392

17

0,286

0,355

0,318

0,381

18

0,279

0,346

0,309

0,371

19

0,271

0,337

0,301

0,361

20

0,265

0,329

0,294

0,352

21

0,259

0,321

0,287

0,344

22

0,253

0,314

0,281

0,337

23

0,248

0,307

0,275

0,330

24

0,242

0,301

0,269

0,323

---

---

---

---

---

 


 

 

Valori critici di Dmax nel test di Kolmogorov-Smirnov

per la bontà dell’adattamento con dati continui e raggruppamenti in classi

Test unilaterali e test bilaterali

con N da 25 a 40

e approssimazione per N > 40

(Proposti da Miller, 1956)

 

 

 

Dimensione del campione

Test Unilaterale

Test Bilaterale

N

a = 0.05

a = 0.01

a = 0.05

a = 0.01

25

0,238

0,295

0,264

0,317

26

0,233

0,290

0,259

0,311

27

0,229

0,284

0,254

0,305

28

0,225

0,279

0,250

0,300

29

0,221

0,275

0,246

0,295

30

0,218

0,270

0,242

0,290

31

0,214

0,266

0,238

0,285

32

0,211

0,262

0,234

0,281

33

0,208

0,258

0,231

0,277

34

0,205

0,254

0,227

0,273

35

0,202

0,251

0,224

0,269

36

0,199

0,247

0,221

0,265

37

0,197

0,244

0,218

0,262

38

0,194

0,241

0,215

0,258

39

0,192

0,238

0,213

0,255

40

0,189

0,235

0,210

0,252

 

> 40

 

 

 

 

---

---

---

---

---

 


 

 

Ore

7-8

9-10

11-12

13-14

15-16

Distribuzione osservata cumulata

0

1

2

11

15

Distribuzione attesa cumulata

3

6

9

12

15

Differenze assolute

3

5

7

1

0

 

 

La differenza assoluta massima è 7.

 

3 - E’ intuitivo pensare che essa possa essere tanto più grande quanto maggiore è lo scarto tra osservato ed atteso. Ma questo valore dipende anche dal numero totale di osservazioni: la differenza massima tende ad aumentare in valore assoluto al crescere delle dimensioni del campione. Anche se la sua significatività è strettamente legata ad esso, è possibile rendere lo scarto massimo assoluto indipendente dal numero totale di osservazioni, mediante il rapporto

 

 

 che, nel caso dell’esempio,

 è  Dmax = 0,466.

 

4 - Sulla tabella dei valori critici di D nel test di Kolmogorov-Smirnov per un campione in un test bilaterale,

-  con un’ampiezza del campione (N) pari a 15 osservazioni,

-  il valore critico della deviazione massima D è

-   0,338 per la probabilità a = 0.05 e

-   0,404 per la probabilità a = 0.01.

Il valore calcolato nell’esempio (uguale a 0,466) risulta maggiore di quelli tabulati sia alla probabilità a = 0.05 che, soprattutto, a quella a = 0.01.

 

5 - Di conseguenza, si rifiuta l’ipotesi nulla H0, secondo la quale le variazioni sono solamente accidentali. Pertanto, implicitamente, si accetta l’ipotesi alternativa H1, secondo la quale le differenze tra distribuzione osservata e distribuzione attesa sono troppo grandi per poter essere, ragionevolmente, ritenuti casuali.

Traducendo il risultato dell’analisi statistica in termini biologici, si può affermare che la specie di uccelli oggetto dell’osservazione si alzi in volo in modo preferenziale durante alcune ore del giorno.

 

L'analisi statistica condotta permette di evidenziare alcune caratteristiche del test.

Se nell’esperimento durante le 12 ore d’osservazione si fossero rilevati 30 individui, il campione sarebbe stato sufficientemente grande per ricorrere all’uso del test .

Tuttavia, per rispettare anche la condizione di avere in ogni casella un valore minimo di osservazioni non inferiore a 5, sarebbe stato necessario raggruppare le osservazioni di classi adiacenti. E’ un’operazione che

-  da una parte permette di rispettare le condizioni di validità;

-  ma dall'altra determina una perdita d’informazione sulle differenze tra le varie ore.

 

Il test di Kolmogorov-Smirnov permette di suddividere il tempo in un numero molto più grande di gruppi: con un’analisi più dettagliata, evidenzia differenze che con il raggruppamento tendono a scomparire. Inoltre, il raggruppamento in classi, per ridurre il numero di gruppi, può contenere una dose elevata di soggettività, determinando differenze tra le due cumulate che variano in rapporto al numero e al tipo di classi formate.

 

Un altro problema importante è distinguere se il test è a una coda oppure a due code. Quello espresso in precedenza, nella quale non veniva indicata la direzione della differenza per un’ora o un gruppo di ore specifiche, era un test bilaterale. Se l’ipotesi alternativa all’ipotesi di uniformità fosse stata che al mattino il numero di avvistamenti è minore di quello pomeridiano, l’ipotesi sarebbe stata unilaterale.

In questa scelta, occorre porre estrema attenzione al fatto che l’ipotesi non può essere formulata osservando i dati, ma deve essere esplicitata a priori.

 

Come già citato, nel 1977 A. N. Pettitt e M. A. Stephens hanno proposto tabelle di valori critici che dipendono anche dal numero di gruppi e dal numero di dati.

Per dimostrare il loro uso e presentare un ulteriore esempio di applicazione di questo test per risposte ordinali raggruppate, si assuma di voler valutare il livello di gradimento di un cibo o un farmaco, sulla base della quantità crescente di una sua componente, come un dolcificante o un semplice eccipiente.

 

A questo scopo, a 35 pazienti sono state fatte assaggiare 5 confezioni, indicate con colori. Essi dovevano indicare solamente la confezione più gradita.

Riordinati i dati sulla base della quantità della sostanza contenuta nelle confezioni sottoposte a giudizio, dalla quantità minore (indicata nella tabella con 1) a quella maggiore (indicata con 5) il numero di preferenze dei 35 pazienti è stata (riga 2)

 

 

1) Rango delle quantità

1 (poco)

2

3

4

5(molto)

2) Gradimenti osservati

8

13

6

6

2

3) Gradimenti attesi con H0 vera

7

7

7

7

7

4) Distribuzione osservata cumulata

8

21

27

33

35

5) Distribuzione attesa cumulata

7

14

21

28

35

6) Differenze assolute

1

7

6

5

0

 

 

1 – Per valutare se la distribuzione si allontana dalla casualità, che in questo caso richiede una distribuzione uniforme o rettangolare, prima si stima la frequenza attesa nella condizione che l’ipotesi nulla di uniformità (H0) sia vera: con 35 casi, sono 7 per ogni confezione (riga 3)

 

2 – Successivamente si calcola la distribuzione cumulata di quella osservata (riga 4) e la distribuzione cumulata di quella attesa (riga 5), determinando la differenza assoluta per ogni gruppo (riga 6).

 

3 – La differenza massima  () risulta 7. Per determinare la significatività, essa deve essere confrontata con la tabella dei valori critici.

Con k = 5  e  N = 35, alla probabilità a = 0.05 bilaterale esso risulta 7, come quello trovato.

Ne consegue che, se fosse vera l’ipotesi nulla, la probabilità P di trovare per caso tale differenza massima è inferiore 0.05 (P < 0.05). E’ una probabilità che permette di rifiutare l’ipotesi nulla: la distribuzione delle frequenze dei gradimenti è significativamente differente da una distribuzione rettangolare.

 

La lettura delle ultime tabelle evidenzia come molte probabilità a abbiano la stessa differenza massima, ovviamente a parità di numero di classi (k) e di numero di dati (N). La causa è che, con pochi dati, la distribuzione è discreta.

Per la significatività deve essere scelta la probabilità a minore.


 

Valori critici di dmax nel test di Kolmogorov-Smirnov

per la bontà dell’adattamento con dati discreti o raggruppati

proposti da Pettitt e Stephens (1977) in test bilaterali

in frequenze attese uguali o moderatamente differenti

 

 

Dimensione del campione

K = 3

N

0.20

0.10

0.05

0.01

0.005

0.001

3

2

2

3

3

3

3

6

3

3

3

4

4

5

9

3

4

4

5

5

6

12

4

4

4

5

6

7

15

4

4

5

6

6

7

18

4

5

5

6

7

8

21

4

5

6

7

7

8

24

5

5

6

7

8

9

27

5

6

6

8

8

9

30

5

6

7

8

9

10

33

5

6

7

8

9

10

36

5

7

7

9

9

11

39

6

7

7

9

10

11

42

6

7

8

9

10

12

45

6

7

8

10

10

12

48

6

7

8

10

11

12

51

6

7

8

10

11

13

54

6

8

9

11

11

13

57

7

8

9

11

12

13

60

7

8

9

11

12

14

63

7

8

9

11

12

14

66

7

8

9

11

12

14

69

7

8

9

12

13

14

72

7

8

9

12

13

15

75

7

8

10

12

13

15

78

7

9

10

12

13

15

81

7

9

10

13

13

16

84

7

9

10

13

14

16

87

7

9

10

13

14

16

90

7

9

10

13

14

16

 


 

 

Valori critici di dmax nel test di Kolmogorov-Smirnov

per la bontà dell’adattamento con dati discreti o raggruppati

proposti da Pettitt e Stephens (1977) in test bilaterali

in frequenze attese uguali o moderatamente differenti

 

 

 

 

Dimensione del campione

K = 4

N

0.20

0.10

0.05

0.01

0.005

0.001

4

2

3

3

3

4

4

8

3

4

4

5

5

5

12

4

4

5

6

6

7

16

4

5

5

6

7

8

20

4

5

6

7

7

8

24

5

6

6

8

8

9

28

5

6

7

8

9

10

32

5

6

7

9

9

10

36

6

7

7

9

10

11

40

6

7

8

9

10

12

44

6

7

8

10

11

12

48

6

7

8

10

11

13

52

7

8

9

11

11

13

56

7

8

9

11

12

13

60

7

8

9

11

12

14

64

7

8

9

12

13

14

68

7

9

10

12

13

15

72

7

9

10

12

13

15

76

8

9

10

12

13

15

80

8

9

10

12

13

15

84

8

9

10

13

14

16

88

8

9

10

13

14

16

92

8

9

10

13

14

16

96

8

9

10

13

14

17

100

8

9

11

13

14

17

 


 

 

Valori critici di dmax nel test di Kolmogorov-Smirnov

per la bontà dell’adattamento con dati discreti o raggruppati

proposti da Pettitt e Stephens (1977) in test bilaterali

in frequenze attese uguali o moderatamente differenti

 

 

 

 

Dimensione del campione

K = 5

N

0.20

0.10

0.05

0.01

0.005

0.001

5

3

3

3

4

4

4

10

3

4

4

5

5

6

15

4

5

5

6

7

7

20

5

5

6

7

7

8

25

5

6

6

8

8

9

30

5

6

7

8

9

10

35

6

7

7

9

10

11

40

6

7

8

10

10

12

45

6

7

8

10

11

12

50

7

8

9

11

11

13

55

7

8

9

11

12

14

60

7

8

9

12

12

14

65

7

9

10

12

13

14

70

8

9

10

12

13

15

75

8

9

10

13

14

15

80

8

9

11

13

14

16

85

8

9

11

13

14

16

90

8

10

11

13

14

16

95

8

10

11

13

14

17

100

8

10

11

14

15

17

 

 

 


 

Valori critici di dmax nel test di Kolmogorov-Smirnov

per la bontà dell’adattamento con dati discreti o raggruppati

proposti da Pettitt e Stephens (1977) in test bilaterali

in frequenze attese uguali o moderatamente differenti

 

 

Dimensione del campione

K = 6

N

0.20

0.10

0.05

0.01

0.005

0.001

6

3

3

4

4

4

5

12

4

4

5

6

6

7

18

4

5

6

7

7

8

24

5

6

6

8

8

9

30

6

6

7

9

9

10

36

6

7

8

9

10

11

42

6

7

8

10

11

12

48

7

8

9

11

11

13

54

7

8

9

11

12

14

60

7

9

10

12

13

14

66

8

9

10

12

13

15

72

8

9

10

13

13

15

78

8

9

11

13

14

16

84

8

9

11

13

14

16

90

8

10

11

14

15

16

96

8

10

11

14

15

17

N

K = 6

7

3

4

4

5

5

5

14

4

5

5

6

7

7

21

5

6

6

7

8

9

28

5

6

7

8

9

10

35

6

7

8

9

10

11

42

6

7

8

10

11

12

49

7

8

9

11

12

13

56

7

8

9

12

12

14

63

8

9

10

12

13

15

70

8

9

10

13

13

15

77

8

9

11

13

14

16

84

8

10

12

13

14

16

91

8

10

12

14

15

17

98

8

10

12

14

15

17


 

 

Valori critici di dmax nel test di Kolmogorov-Smirnov

per la bontà dell’adattamento con dati discreti o raggruppati

proposti da Pettitt e Stephens (1977) in test bilaterali

in frequenze attese uguali o moderatamente differenti

 

 

 

Dimensione del campione

K = 8

N

0.20

0.10

0.05

0.01

0.005

0.001

8

3

4

4

5

5

6

16

4

5

6

7

7

8

24

5

6

7

8

8

9

32

6

7

7

9

10

11

40

6

7

8

10

11

12

48

7

8

9

11

12

13

56

7

9

10

12

12

14

64

8

9

10

12

13

15

72

8

9

11

13

14

15

80

8

10

11

13

14

16

88

8

10

11

14

15

17

96

9

10

11

14

15

17

N

K = 9

9

4

4

4

5

5

6

18

5

5

6

7

7

8

27

6

6

7

8

9

10

36

6

7

8

10

10

11

45

7

8

9

11

11

13

54

7

9

10

11

12

14

63

8

9

10

12

13

15

72

8

10

11

13

14

16

81

8

10

11

13

14

16

90

9

10

11

14

15

17

99

9

10

12

14

15

18

 

 


 

Valori critici di dmax nel test di Kolmogorov-Smirnov

per la bontà dell’adattamento con dati discreti o raggruppati

proposti da Pettitt e Stephens (1977) in test bilaterali

in frequenze attese uguali o moderatamente differenti

 

 

Dimensione del campione

K = 10

N

0.20

0.10

0.05

0.01

0.005

0.001

10

4

4

5

5

6

6

20

5

6

6

7

8

9

30

6

7

7

9

9

11

40

7

8

8

10

11

12

50

7

8

9

11

12

13

60

8

9

10

12

13

15

70

8

10

11

13

14

15

80

9

10

11

14

14

16

90

9

10

12

14

15

17

100

9

10

12

14

15

18

N

K = 11

11

4

4

5

6

6

7

22

5

6

6

8

8

9

33

6

7

8

9

10

11

44

7

8

9

11

11

13

55

8

9

10

12

12

14

66

8

9

11

13

14

15

77

9

10

11

13

14

16

88

9

10

12

14

15

17

99

9

10

12

14

16

18

N

K = 12

12

4

5

5

6

6

7

24

5

6

7

8

9

10

36

6

7

8

10

10

12

48

7

8

9

11

12

13

60

8

9

10

12

13

15

72

9

10

11

13

14

16

84

9

10

11

14

15

17

96

9

10

12

14

15

18


 

Sebbene i gruppi siano di tipo ordinale e non qualitativi, con gli stessi dati è possibile stimare il valore del c2.

 

Con la formula

 

 applicata alle frequenze riportate in tabella

 

Rango delle quantità

1

2

3

4

5

 

 

 

Totale

1) Gradimenti osservati

8

13

6

6

2

2) Gradimenti attesi, se H0 vera

7

7

7

7

7

3) Differenze

1

6

1

1

5

4) Valori del

0,143

5,143

0,143

0,143

3,541

9,143

 

 

 si ottiene c2 = 9,143 totale, con  gdl = 4.

Nella tavola dei valori critici del c2 con gdl = 4

-          alla probabilità a = 0.10 il valore critico è 7,779

-          alla probabilità a = 0.05 il valore critico è 9,488

Il valore calcolato è minore di quello critico per la probabilità a = 0.05; quindi non è possibile rifiutare l’ipotesi nulla, contrariamente a quanto concluso in precedenza.

E’ una dimostrazione molto semplice della diversa potenza e della necessità di utilizzare sempre il test più potente, ovviamente nel rispetto delle condizioni di validità.

Tuttavia le probabilità P non è molto differente. All’aumentare di N, le due stime convergono.

 

PER DATI CONTINUI

Tra i testi internazionali, è riportato in quelli di

-  Hollander Myles, Wolfe Douglas A., 1999, Nonparametric Statistical Methods, 2nd ed. John Wiley & Sons, New York, 787 pp.

-  Sprent P., 1993, Applied nonparametric statistical methods, 2nd  Edition, Chapman & Hall, London.

-  Zar Jerrold H. del 1999 Biostatistical Analysis, fourth ed., Prentice Hall, Englewood Cliffs, New Jersey, USA, pp.663 + 203app.

A essi si rinvia per ulteriori approfondimenti e tabelle dei valori critici più estese.

 

Il test è utile in studi sulla sopravvivenza dopo un’operazione, in tossicologia dopo la somministrazione di un principio attivo, in etologia quando si valuta il tempo di comparsa di una reazione a uno stimolo, quando il tempo è valutato in modo continuo, senza quindi la comparsa di ties. Un numero molto limitato di ties è tuttavia accettabile. Anche in questo caso, il metodo è illustrato l’applicazione a un esempio.

 

Si assuma che a 20 cavie sia stato somministrato un principio attivo e che esse siano state poste sotto osservazione continua  per sei giorni, misurando il tempo di comparsa del sintomo in ore, tradotte con approssimazione in decimi di giorno. Si vuole valutare se la probabilità di comparsa è costante o uniforme nel tempo.

 

1- La prima elaborazione dei dati osservati  è la sua distribuzione ordinata dal minore al maggiore, come  nella colonna 2. In essa compare due volte la misura 3,4.

 

(1)

(2)

(3)

(4)

(5)

Freq. Oss.

Freq. Att.

= (3) - (4)

1

0,6

0,10

0,05

+ 0,05

2

0,8

0,13

0,10

+ 0,03

3

1,1

0,18

0,15

+ 0,03

4

1,2

0,20

0,20

0,00

5

1,4

0,23

0,25

- 0,02

6

1,7

0,28

0,30

- 0,02

7

1,8

0,30

0,35

- 0,05

8

1,9

0,32

0,40

- 0,08

9

2,2

0,37

0,45

- 0,08

10

2,4

0,40

0,50

- 0,10

11

2,5

0,42

0,55

- 0,13

12

2,9

0,48

0,60

- 0,12

13

3,1

0,52

0,65

- 0,13

14

3,4

3,4

0,57

 

0,75

- 0,18

15

16

3,9

0,65

0,80

- 0,15

17

4,4

0,73

0,85

- 0,12

18

4,9

0,82

0,90

- 0,08

19

5,2

0,87

0,95

- 0,08

20

5,9

0,98

1,00

- 0,02

 

 

2 – La seconda operazione da effettuare è la trasformazione dei dati rilevati in valori relativi (vedi colonna 3).

Poiché il tempo dell’esperimento è 6 giorni 

-          il primo individuo che ha avuto la comparsa dopo giorni 0,6 ha un valore relativo di 0,10 (0,6/6)

-          il secondo con 0,8 giorni ha un valore relativo di 0,13 (0,8/6).

 

3 – La stessa operazione deve essere fatta per le frequenze attese. Con 20 osservazioni in 6 giorni, se la distribuzione fosse stata uniforme nel tempo (H0 vera), si sarebbe osservato un nuovo caso ogni ventesimo del tempo totale, cioè 0,05. Nella colonna 4 sono riportati i valori cumulati.

Il ties comporta maggiore attenzione in questo calcolo semplice

 

4 – Per ogni coppia di frequenze cumulate (Osservata – Attesa) si calcola la differenza, come riporta in colonna 5.

 


 

La rappresentazione grafica, nella quale in ascissa è riportato la cumulata dei valori osservati (X) e in ordinata la frequenza cumulata attesa (Y), evidenzia la differenza tra le due distribuzioni.

 

5 – La differenza massima relativa D è 0,18 corrispondente alla osservazione  = 3,4.

Sulla tabella dei valori critici di Miller, per un test bilaterale con N = 20 alla probabilità a = 0.05 il valore riportato è 0,294.

Il valore calcolato è minore, quindi non sui può rifiutare l’ipotesi nulla in quanto P > 0.05.

 

Il test poteva anche essere impostato con ipotesi alternativa unilaterale. Ad esempio, si poteva supporre che nei primi giorni, dato il tempo richiesto dalla prima comparsa dei sintomi, le frequenze osservate fossero minori di quelle attese, rispetto a una ipotesi di distribuzione rettangolare o uniforme.

Il grafico mostra che i dati osservati sono in accordo con questa attesa teorica; ma lo scarto massimo di quella zona (+0,05) è nettamente inferiore al valore critico per un test unilaterale. Infatti nella tavola dei valori critici di Miller, per un test unilaterale con N = 20 alla probabilità a = 0.05 il valore riportato è 0,265. Non è dimostrata una differenza unilaterale dall’atteso.

 

Il test di Kolmogorov-Smirnov può essere utilizzato per verificare l’accordo di una distribuzione sperimentale con qualsiasi distribuzione, compresa la distribuzione normale. La metodologia è leggermente modificata e i valori critici sono differenti.

Per questa specifica applicazione, è utile il test proposto da H. W. Lilliefors nel 1967, modificando il test di Kolmogorov-Smirnov come dichiara appunto il titolo del suo articolo (On the Kolmogorov – Smirnov test for normality with mean and variance unknown, pubblicato su Journal of the American Statistical Association Vol. 62, pp.399 – 402).

 

 

 

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007