METODI NON PARAMETRICI PER DUE CAMPIONI DIPENDENTI

 

 

8.3.  INTERVALLO DI CONFIDENZA DELLA DIFFERENZA TRA LE PROPORZIONI DI DUE CAMPIONI DIPENDENTI.

 

 

Secondo vari ricercatori, quando si confrontano due medie o due proporzioni, l’intervallo di confidenza della differenza è da preferire al test di significatività, in quanto fornisce una informazione maggiore. Anche nel caso di tabelle di McNemar è possibile stimare l’intervallo di confidenza della differenza tra le due proporzioni.

Nell’esempio già utilizzato nel paragrafo precedente

 

 

 

+      DOPO      -

Totale

                 +

A   84

B   35

119

PRIMA     -

C   74

D   26

100

Totale

158

61

N   219

 

 si evidenzia che

-          la proporzione di persone favorevoli (+) prima dell’intervento era

pprima = 119/219 = 0,543

 

-          la proporzione di persone favorevoli (+) dopo l’intervento era

pdopo = 158/219 = 0,543 = 0,721

Nel campione, il consenso è quindi aumentato di  una proporzione  p = 0,178 (0,721 – 0,543).

 

E’ il risultato che si ottiene anche dalla differenza tra le 219 persone intervistate che erano favorevoli dopo (158/219) e quante erano favorevoli prima (119/219).

 

 

Individui

Prima

Dopo

1

+

-

2

-

+

3

+

+

--

219

Totale +  119

Totale +  158

 

Trattandosi di un campione sufficientemente grande, con la distribuzione normale è possibile calcolare l’intervallo di confidenza della differenza tra le due proporzioni, mediante

 

Rispetto ai metodi illustrati nel capitolo IV per la differenza tra due proporzioni, in questo caso la stima della deviazione standard (sp, che in realtà è un errore standard poiché p è una media) è differente perché si tratta di due campioni dipendenti.

Tra i testi internazionali a maggior diffusione, la formula da utilizzare è proposta da Alan Agresti e Barbara Finlay nel loro volume del 1999 (Statistical Methods for the Social Sciences ,3rd edition,  Prentice Hall, Upper Saddle River, New Jersey).

Dopo aver calcolato le proporzioni sul totale, come riportato nella tabella,

 

 

 

+      DOPO      -

Totale

                 +

= 0,383

= 0,160

= 0,543

PRIMA     -

= 0,338

= 0,119

---

Totale

 = 0,721

---

N = 219

 

 

 si stima la varianza () della differenza (=-)

 attraverso

 

Con i dati dell’esempio, dove

-           = 119 / 219 = 0,543       = 158 / 219 = 0,721        N = 219

-          = 84/219 = 0,383    = 35/219 = 0,160    = 74/219 = 0,338     26/219 = 0,119

 si ottiene

 

  

 

Successivamente,  si stima l’intervallo di confidenza alla probabilità a = 0.05,

 mediante

 con

p = 0,170        Z = 1,96     

 ottenendo

 come limiti 0,17 ±0,09 cioè 0,08 come limite inferiore e 0,26 come limite superiore.

 

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007