METODI NON PARAMETRICI PER DUE CAMPIONI INDIPENDENTI

 

 

 

9.2.   TEST UNILATERALE PER TABELLE 2 X 2 ANALOGO AL

 

 

La formula per il calcolo rapido del chi quadrato per le tabelle di contingenza 2 x 2, in campioni sufficientemente grandi

 applicata alla tabella


 

 

Persone  con malattie

Persone senza malattie

Totale

Zona a alto inquinamento

32   

48   

80  

Zona a basso inquinamento

13   

57   

70  

Totale

45   

105   

150  

 

 dove

- a, b, c, d   sono le frequenze osservate nei due campioni indipendenti a confronto,

n1, n2, n3, n4   sono i totali marginali,

N  è il totale generale di osservazioni.

 come risultato ha dato

c2(1) = [ (32 x 57 - 48 x 13)2 x  150 ] / (80 x 70 x 45 x 105)

c2(1) = (1824 - 624)2 x 150 / 26460000 = 1440000 x 150 / 26460000 = 8,163

 un c2(1)   = 8,163.

Tale test è bilaterale e serve per verificare l’ipotesi alternativa che

- la proporzione di individui con malattie polmonari che vivono nella zona a alto inquinamento (pa)

- sia differente dalla proporzione di quelli che vivono in zone a basso inquinamento (pb)

In termini più formali, si verifica

- l’ipotesi nulla  H0papb

- contro l’ipotesi alternativa H1pa ¹  pb

 

Spesso, come in realtà in questo caso, l’ipotesi è unilaterale. Più esattamente, nella zona campionata si intende verificare

-  se è vera l’asserzione che nelle zone a alto inquinamento (pa) la proporzione di persone con malattie polmonari sia maggiore

- di quella presente nelle zone a basso inquinamento (pb).

Pertanto si vuole verificare

- l’ipotesi nulla  H0pa £  pb

- contro l’ipotesi alternativa H1papb

Ovviamente, in altre situazioni oppure in questo caso con una impostazione differente della tabella, l’ipotesi potrebbe essere nell’altra direzione.

Come primo passo si possono calcolare

-  =  =  = 0,400

-  =  =  = 0,186

 le due frequenze relative campionarie  e .

Esse evidenziano che i dati del campione sono in accordo con la teoria espressa, poiché effettivamente  > . Il test statistico serve per valutare se tale differenza sia imputabile al caso oppure sia più ragionevole attribuirla a una differenza reale.

 

Nel testo di  Conover W. J. del 1999, Practical Nonparametric Statistics (3rd ed. John Wiley & Sons, New York, VIII + 584 p.) giustificato dalla relazione

 

 per un test unilaterale è proposta la relazione

 

 che risulta positivo quando  > .

Con i dati dell’esempio,

 

 

si ottiene z = 2,857 che è esattamente uguale a  ma con il vantaggio di essere un test unilaterale: più corretto, in questo caso, e più potente poiché con probabilità dimezzata.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007