Services and Training for Six Sigma, Design of Experiments and Industrial Statistics

METODI NON PARAMETRICI PER DUE CAMPIONI DIPENDENTI

8.3. INTERVALLO DI CONFIDENZA DELLA DIFFERENZA TRA LE PROPORZIONI DI DUE CAMPIONI DIPENDENTI.

Secondo vari ricercatori, quando si confrontano due medie o due proporzioni, l’intervallo di confidenza della differenza è da preferire al test di significatività, in quanto fornisce una informazione maggiore. Anche nel caso di tabelle di McNemar è possibile stimare l’intervallo di confidenza della differenza tra le due proporzioni.

Nell’esempio già utilizzato nel paragrafo precedente

	+ DOPO -		Totale
+	A 84	B 35	119
PRIMA -	C 74	D 26	100
Totale	158	61	N 219

si evidenzia che

- la proporzione di persone favorevoli (+) prima dell’intervento era

p_prima = 119/219 = 0,543

- la proporzione di persone favorevoli (+) dopo l’intervento era

p_dopo = 158/219 = 0,543 = 0,721

Nel campione, il consenso è quindi aumentato di una proporzione p = 0,178 (0,721 – 0,543).

E’ il risultato che si ottiene anche dalla differenza tra le 219 persone intervistate che erano favorevoli dopo (158/219) e quante erano favorevoli prima (119/219).

Individui	Prima	Dopo
1	+	-
2	-	+
3	+	+
--	…	…
…	…	…
219	Totale + 119	Totale + 158

Trattandosi di un campione sufficientemente grande, con la distribuzione normale è possibile calcolare l’intervallo di confidenza della differenza tra le due proporzioni, mediante

Rispetto ai metodi illustrati nel capitolo IV per la differenza tra due proporzioni, in questo caso la stima della deviazione standard (s_p, che in realtà è un errore standard poiché p è una media) è differente perché si tratta di due campioni dipendenti.

Tra i testi internazionali a maggior diffusione, la formula da utilizzare è proposta da Alan Agresti e Barbara Finlay nel loro volume del 1999 (Statistical Methods for the Social Sciences ,3^rd edition, Prentice Hall, Upper Saddle River, New Jersey).

Dopo aver calcolato le proporzioni sul totale, come riportato nella tabella,