CORRELAZIONE E COVARIANZA
18.6. DIFFERENZA TRA DUE COEFFICIENTI DI CORRELAZIONE, IN CAMPIONI INDIPENDENTI; CALCOLO DEL COEFFICIENTE COMUNE
Il confronto tra due coefficienti di correlazione r1 e r2, calcolati su due campioni indipendenti, per verificare l’ipotesi nulla H0: r1 = r2 con ipotesi alternativa sia bilaterale H1: r1 ¹ r2 che unilaterale H1: r1 < r2 oppure H1: r1 > r2 pone sempre il problema della forte asimmetria dei valori campionari alla quale si aggiunge quella della non omogeneità delle due varianze. La simmetria e la omoschedasticità sono ricostruite mediante la trasformazione di Fisher, per cui il test diventa
dove - Z è il valore della distribuzione normale, unilaterale o bilaterale in rapporto all’ipotesi alternativa, - e sono r1 e r2 trasformati con la formula di Fisher, - è l’errore standard della differenza precedente, ottenuta con
come formula generale e con la formula semplificata
quando i due campioni sono bilanciati(n1 = n2) Con poche decine di dati, all’uso della distribuzione normale alcuni preferiscono l’uso della tabella t con df = N-4, in quanto più cautelativa. Permane il problema che solitamente i testi per la distribuzione t riportano solo le tavole sinottiche; quindi risulta impossibile stimare la probabilità in modo più preciso.
Nel caso di due campioni dipendenti, come possono essere i coefficienti di correlazione del padre e quello della madre con una caratteristica di un figlio, calcolate su varie coppie di genitori, la procedura è differente.
Se i due coefficienti di correlazione r1 e r2 non risultano significativamente differenti, anche sulla base della potenza del test e delle dimensioni del campione si può concludere che r1 = r2. In tali condizioni, spesso è utile calcolare un coefficiente di correlazione comune o pesato (common or weighted correlation coefficient); è la misura più corretta della correlazione tra le variabili X1 e X2, in quanto media ponderata dei risultati dei due esperimenti. Sempre per i problemi di simmetria e omoschedasticità, per ottenere il coefficiente di regressione comune rw - dopo la trasformazione di r1 e r2 rispettivamente in z1 e z2 - si calcola il valore medio zw con
che, nel caso di n1 = n2 , può essere semplificata in
- Infine si trasforma zw in rw con
Recentemente, sono stati proposti altri metodi, che dovrebbero dare stime più precise di rw.
ESEMPIO a) Calcolare la significatività della differenza tra i due coefficienti di correlazione - r1 = 0,22 con n1 = 30 e - r2 = 0,31 con n2 = 50 b) Calcolare inoltre il coefficiente di correlazione ponderato rw.
Risposte a) Dopo aver trasformato r1= 0,22
in z1 = 0,224 e r2 = 0,31
in z2 = 0,321 - si calcola l’errore standard della differenza z1-z2
ottenendo = 0,24. Da essi si ricava
un valore di Z = -0,40. Nella distribuzione normale bilaterale, poiché la domanda verte solo sulla significatività della differenza tra i due coefficienti di correlazione r1 e r2, a Z = -0,40 corrisponde una probabilità a = 0,689. Pure senza un’analisi della potenza del test, illustrata nel paragrafo successivo, la probabilità è così alta che si può concludere non esiste alcuna differenza tra i due coefficienti angolari.
Nel caso di un test unilaterale, rispetto alla procedura illustrata l’unica differenza consiste nella stima della probabilità a, non diversamente dal test t su due medie o due coefficienti angolari.
b) Per ottenere il coefficiente ponderato rw, con - z1 = 0,224 e n1 = 30 - z2 = 0,321 e n2 = 50
- dapprima si stima zw
che risulta uguale a 0,286 - infine con la trasformazione
si ricava rw = 0,278. Il coefficiente di correlazione comune o ponderato tra - r1 = 0,22 con n1 = 30 e - r2 = 0,31 con n2 = 50 è rw = 0,278.
| |
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |