TEST NON PARAMETRICI PER PIU' CAMPIONI
15.9. ESTENSIONE DEL TEST DI McNEMAR O TEST DI BOWKER
Quando, con due campioni dipendenti le risposte non sono binarie ma hanno tre o più modalità, si costruisce una tabella quadrata N x N per analizzare la simmetria ai lati della diagonale. E’ il test proposto da A. H. Bowker nel 1948 (con l’articolo A test for simmetry in contingency tables pubblicato su J. Amer. Statist. Assoc., 43, pp. 572-4) per verificare, come permette il test di Mc Nemar con risposte binarie, l’ipotesi che nel confronto tra due situazioni sia avvenuto un cambiamento significativo nella frequenza delle varie modalità. Tra i testi di statistica non parametrica a maggior diffusione, questo metodo è presentato da P. Sprent nel volume Applied nonparametric statistical methods, (second Edition, Chapman & Hall, London, 1993, pp. 239-240).
Nella ricerca ambientale, si ricorre al test di Bowker nel caso in cui si confrontano le risposte multiple (non binarie) delle stesse persone prima e dopo uno stimolo o i differenti effetti di due sostanze tossiche, somministrate allo stesso gruppo di cavie. E’ un approccio diverso dal Q di Cochran, poiché in questo caso le risposte sono date non una volta sola ma due volte (prima e dopo l’evento) e esse sono di tipo ordinale, non binario.
Si supponga che un’amministrazione comunale abbia deciso la chiusura del centro storico al traffico automobilistico. Prima della delibera è stato fatto un sondaggio nominativo su un campione di individui residenti nella zona storica, deducendo da una serie di risposte se erano favorevoli, incerti o contrari. Dopo due mesi di applicazione del divieto, il test è stato ripetuto sugli stessi individui.
La sottostante tabella 3 x 3 riporta il numero di individui per ognuna delle 9 combinazioni di risposte.
La diagonale fornisce il numero di coloro che hanno mantenuto lo stesso parere, mentre le altre caselle riportano il numero di coloro che lo hanno cambiato in una direzione oppure nell’altra. Si vuole sapere se esistono differenze statisticamente significative tra prima e dopo. Una indicazione preliminare, solo descrittiva, può essere fornita dai totali marginali
dai quali risulta che i favorevoli sono aumentati da 136 (prima) a 167 (dopo) e quelli incerti sono aumentati da 87 (prima ) a 89 (dopo) mentre i contrari sono diminuiti da 167 (prima) a 134 (dopo). Ma, trattandosi di due campioni dipendenti, come per il test di Mc Nemar la risposta per l’inferenza è fornita da quelli che hanno cambiato parere (in grassetto nella tabella). Il test presentato da Bowker confronta le frequenze distribuite che sono in modo simmetrico rispetto alla diagonale: se HO è vera, dovrebbero essere approssimativamente uguali.
I concetti ed il metodo sono semplici e possono essere descritti in 4 passaggi logici.
1 - Se non è intervenuto nessun mutamento sistematico nelle opinioni espresse dagli intervistati (H0 vera), a) coloro che prima erano Incerti e dopo sono diventati Favorevoli (28) dovrebbero essere equivalenti a quelli che prima erano Favorevoli e dopo Incerti (16); b) coloro che prima erano Contrari e dopo Favorevoli (54) dovrebbero essere equivalenti a quelli che prima erano Favorevoli e dopo sono Contrari (35); c) coloro che prima erano Contrari e dopo Incerti (39) dovrebbero essere equivalenti a quelli che prima erano Incerti e dopo Contrari (25).
In modo più formale, l’ipotesi nulla è H0: pij = pji contro l’ipotesi alternativa H1: pij ¹ pji con esclusione dei valori della diagonale.
2 – Il confronto è effettuato mediante un c2 che considera la differenza tra la frequenza assoluta di una casella non collocata sulla diagonale e quella ad essa simmetrica, con una formula = dove - la sommatoria è estesa a tutti gli i da 1 a n-1 ma solo con j > i,
Con i dati dell’esempio, si ottiene
un valore uguale a 10,85
3 – Sotto l’ipotesi nulla di simmetria dei dati, la distribuzione asintotica (teoricamente, per un numero n di dati tendente all’infinito; in pratica per n sufficientemente grande) è un chi quadrato con gdl gdl = Con i dati dell’esempio, i gdl gdl = = 3
sono 3, corrispondenti alle 3 somme fatte o 3 coppie di valori a confronto (indicate con a, b, c, nella tabella), derivanti dalla combinazione
4 - Poiché il valore del chi quadrato con 3 gdl - alla probabilità a = 0.05 è uguale a 7,815, - alla probabilità a = 0.01 è uguale a 11,345, si rifiuta l’ipotesi nulla, con una probabilità P inferiore a a = 0.05.
ESEMPIO. Per valutare l’impatto di una discarica sulla popolazione residente in un comune, prendendo un campione nominativo è stato fatta un’indagine sulla percezione di odori sgradevoli, fornendo 4 livelli di risposta: mai, di rado, spesso, sempre. Dopo un anno, l’indagine è stata ripetuta sugli stessi individui con i seguenti risultati complessivi:
Si può sostenere che l’intervento ha modificato la situazione in modo statisticamente significativo?
Risposta. Indicando la posizione dei dati (esclusa la diagonale) con Xij come nella tabella
Il metodo si fonda su quattro passaggi logici:
1- per verificare l’ipotesi nulla H0: pij = pji contro l’ipotesi alternativa H1: pij ¹ pji per tutti gli i da 1 a n-1 con j > i, il confronto è tra i valori a destra della diagonale con quelli a sinistra, che occupano la posizione simmetrica (esempio X1,2 contro X2,1 e X2,4 contro X4,2… );
2 - con la formula =
in cui la sommatoria è estesa a tutti gli i da 1 a n-1 con j > i si calcola un valore del chi quadrato
= = 2,92 + 9,81 + 4,57 + 0,49 + 0,50 + 2,69 = 20,98
che risulta uguale a 20,98.
3 – Con il rapporto gdl = applicato alla matrice 4 x 4 gdl =
si stimano 6 gdl, che corrispondono al numero di coppie di dati a confronto, cioè la combinazione
4 – Infine, poiché il valore critico del chi quadrato con 6 gdl - alla probabilità a = 0.05 è uguale a 12,592 e - alla probabilità a = 0.01 è uguale a 16,815 si rifiuta l’ipotesi nulla, con una probabilità P inferiore a 0.01.
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |