TEST NON PARAMETRICI PER PIU' CAMPIONI
15.8. Il test Q di Cochran
Con un esperimento organizzato come i blocchi randomizzati già discussi nell’analisi della varianza a due criteri di classificazione, quando le risposte sono di tipo binario nella statistica non parametrica è possibile ricorrere al test Q di W. G. Cochran pubblicato nel 1950 (vedi The comparisons of percentages in matched samples, su Biometrika vol. 37, pp. 256-266). Il test serve per verificare se il numero, la proporzione o la frequenza totale di successi o insuccessi di N prove ripetute (da cui anche il nome di analisi della varianza a misure ripetute) differiscono in modo significativo tra le varie situazioni a confronto. In vari testi è presentato come l’estensione a k campioni del test di McNemar.
Il test Q di Cochran è utilizzato quando si devono valutare i risultati di sondaggi o giudizi qualitativi binari (sufficiente o insufficiente; accettabile o non-accettabile; migliorato o non migliorato) espressi dalle stesse persone su una serie di tre o più provvedimenti o situazioni. Le valutazioni devono essere rappresentate mediante una votazione binaria, indicata solo mediante 0 e 1. Per esempio, è possibile chiedere ad un gruppo di N persone - se la situazione ambientale è ritenuta accettabile o no, - se a loro parere nell’ultimo anno la qualità della vita sia migliorata oppure no, - se la confezione di un prodotto industriale, oppure il colore o il sapore di un farmaco è gradito oppure no confrontando simultaneamente K situazioni o prodotti
I risultati devono essere riportati in una tabella a due entrate come quella sottostante
in cui, di norma, - sulle righe sono indicati i valori attribuiti da ogni individuo e - nelle colonne sono riportate le varie situazioni (in questo esempio i quartieri o leconfrzioni di prodotto). Il test serve per verificare se le valutazioni assegnate alle varie colonne sono simili o statisticamente differenti: se le percentuali o proporzioni di 1 (oppure di 0) calcolate per colonna sono uguali (H0) oppure significativamente differenti (H1).
Con r righe e c colonne, si calcola il valore Q mediante la formula di Cochran
dove, - k è il numero di colonne, - Cj è il numero totale di successi nella colonna j-esima, - Ri è il numero totale di successi nelle riga i-esima.
Quando il numero di righe non è troppo piccolo, Q segue la distribuzione con gdl k-1.
Per l’uso dei valori critici riportati nella tabella del chi quadrato, il campione è ritenuto di dimensioni accettabili quando il numero totale di osservazioni (N individui per k situazioni) è complessivamente uguale o maggiore di 24 e contemporaneamente il numero di righe (N) non è inferiore a 4. Per esperimenti di dimensioni minori, non presentati in questa trattazione, possono essere ottenute stime esatte dei valori critici mediante le permutazioni. E’ tuttavia diffusa la prassi di utilizzare comunque la distribuzione chi quadrato, poiché i calcoli con le permutazioni richiedono molto tempo e in conclusione determinano valori approssimativamente simili a quelli ottenuti con il chi quadrato. Come potrà essere messo in evidenza con l’esempio, le righe composte solo da valori identici, siano essi tutti 0 oppure tutti 1 (come le risposte dell’individuo 1 e dell’individuo 3 nella tabella precedente) non influiscono sul valore dell’indice Q. Esso risente solo delle valutazioni differenti, che variano il numero di risposte positive tra colonne. Di conseguenza, per calcolare le dimensioni reali di una tabella si devono considerare solo le righe con valori che non siano tutti 1 oppure tutti 0. Anche in questo caso, la metodologia è spiegata in modo semplice seguendo la soluzione di un problema.
Esempio. In una città con gravi problemi di traffico è stata profondamente modificata la circolazione del trasporto privato, cambiando sensi unici e divieti, sia di accesso, sia di sosta. Anche se la situazione in complesso appare migliorata, gli abitanti di alcuni quartieri non si ritengono soddisfatti, ritenendo che nella loro zona la nuova situazione non presenti gli stessi vantaggi evidenti in altri, riguardo all’inquinamento acustico e a quello dell’aria, al controllo del traffico e alla qualità della vita in genere. A 15 esperti di vari settori della qualità della vita, è stato chiesto un giudizio sulla situazione di 4 quartieri (I, II, III, IV). Essi devono rispondere se, rispetto all’anno precedente, in ogni quartiere la situazione è migliorata (1) oppure no (0) (cioè come prima o peggiorata). . La tabella riporta le 15 risposte, indicando con 1 quelle positive e con 0 quelle non positive (di parità oppure negative, poiché la risposta può essere solo binaria).
Si può sostenere che i 4 quartieri hanno avuto variazioni differenti, per cui in essi la qualità della vita è migliorata in modo significativamente diverso?
Risposta. Per l’applicazione della formula di Cochran, occorre dapprima calcolare - il totale di ogni colonna (Cj), - il totale di ogni riga (Ri ), - e quello dei suoi quadrati (Ri2),
che risultano uguali a
Applicando ai dati la formula di Cochran
si ottiene un valore di Q uguale a 3,9. La sua significatività deve essere verificata con i valori critici della distribuzione con 3 gdl, che alla probabilità a = 0.05 fornisce il valore 7,82. Il valore calcolato (3,9) è inferiore non solo a quello critico della probabilità a = 0.05 ma anche a quello della probabilità a = 0.10. Si deve concludere che non è dimostrato che nei 4 quartieri la situazione sia cambiata in modo significativamente diverso; anzi, l’alto valore di P (P > 0.10) permette di concludere che è probabilmente l’ipotesi nulla è vera (non solo non è rifiutata) e quindi che la qualità della vita nei 4 quartieri è migliorata in modo relativamente uniforme.
Quando il numero di colonne o risposte è uguale a 2, le N risposte in un test di Cochran, riportate nelle righe, possono essere riassunte in una tabella 2 x 2 e quindi analizzate come test di Mc Nemar, sempre attraverso la distribuzione chi quadrato.
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |