METODI NON PARAMETRICI PER DUE CAMPIONI DIPENDENTI
8.3. INTERVALLO DI CONFIDENZA DELLA DIFFERENZA TRA LE PROPORZIONI DI DUE CAMPIONI DIPENDENTI.
Secondo vari ricercatori, quando si confrontano due medie o due proporzioni, l’intervallo di confidenza della differenza è da preferire al test di significatività, in quanto fornisce una informazione maggiore. Anche nel caso di tabelle di McNemar è possibile stimare l’intervallo di confidenza della differenza tra le due proporzioni. Nell’esempio già utilizzato nel paragrafo precedente
si evidenzia che - la proporzione di persone favorevoli (+) prima dell’intervento era pprima = 119/219 = 0,543
- la proporzione di persone favorevoli (+) dopo l’intervento era pdopo = 158/219 = 0,543 = 0,721 Nel campione, il consenso è quindi aumentato di una proporzione p = 0,178 (0,721 – 0,543).
E’ il risultato che si ottiene anche dalla differenza tra le 219 persone intervistate che erano favorevoli dopo (158/219) e quante erano favorevoli prima (119/219).
Trattandosi di un campione sufficientemente grande, con la distribuzione normale è possibile calcolare l’intervallo di confidenza della differenza tra le due proporzioni, mediante
Rispetto ai metodi illustrati nel capitolo IV per la differenza tra due proporzioni, in questo caso la stima della deviazione standard (sp, che in realtà è un errore standard poiché p è una media) è differente perché si tratta di due campioni dipendenti. Tra i testi internazionali a maggior diffusione, la formula da utilizzare è proposta da Alan Agresti e Barbara Finlay nel loro volume del 1999 (Statistical Methods for the Social Sciences ,3rd edition, Prentice Hall, Upper Saddle River, New Jersey). Dopo aver calcolato le proporzioni sul totale, come riportato nella tabella,
si stima la varianza () della differenza (=-) attraverso
Con i dati dell’esempio, dove - = 119 / 219 = 0,543 = 158 / 219 = 0,721 N = 219 - = 84/219 = 0,383 = 35/219 = 0,160 = 74/219 = 0,338 26/219 = 0,119 si ottiene
Successivamente, si stima l’intervallo di confidenza alla probabilità a = 0.05, mediante
con p = 0,170 Z = 1,96 ottenendo
come limiti 0,17 ±0,09 cioè 0,08 come limite inferiore e 0,26 come limite superiore.
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |