CORRELAZIONE  E  COVARIANZA

 

 

18.6.   DIFFERENZA TRA DUE COEFFICIENTI DI CORRELAZIONE, IN CAMPIONI INDIPENDENTI;  CALCOLO DEL COEFFICIENTE COMUNE

 

Il confronto tra due coefficienti di correlazione r1 e r2, calcolati su due campioni indipendenti, per verificare

 l’ipotesi nulla

H0: r1 = r2

 con ipotesi alternativa sia bilaterale

H1: r1 ¹ r2

 che unilaterale

H1: r1 < r2     oppure      H1: r1 >  r2

 pone sempre il problema della forte asimmetria dei valori campionari alla quale si aggiunge quella della non omogeneità delle due varianze.

La simmetria e la omoschedasticità  sono ricostruite mediante la trasformazione di Fisher, per cui il test diventa

dove

-   Z è il valore della distribuzione normale, unilaterale o bilaterale in rapporto all’ipotesi alternativa,

-    e  sono r1 e r2 trasformati con la formula di Fisher,

-    è l’errore standard della differenza precedente, ottenuta

 con

come formula generale e

 con la formula semplificata

 quando i due campioni sono bilanciati(n1 = n2)

Con poche decine di dati, all’uso della distribuzione normale alcuni preferiscono l’uso della tabella t con df = N-4, in quanto più cautelativa. Permane il problema che solitamente i testi per la distribuzione t riportano solo le tavole sinottiche; quindi risulta impossibile stimare la probabilità in modo più preciso.

 

 

Nel caso di due campioni dipendenti, come possono essere i coefficienti di correlazione del padre e quello della madre con una caratteristica di un figlio, calcolate su varie coppie di genitori, la procedura è differente.

 

 

Se i due coefficienti di correlazione r1 e r2 non risultano significativamente differenti, anche sulla base della potenza del test e delle dimensioni del campione si può concludere che r1 = r2. In tali condizioni, spesso è utile calcolare un coefficiente di correlazione comune o pesato (common or weighted correlation coefficient); è la misura più corretta della correlazione tra le variabili X1 e X2, in quanto media ponderata dei risultati dei due esperimenti.

Sempre per i problemi di simmetria e omoschedasticità,  per ottenere il coefficiente di regressione comune rw

-  dopo la trasformazione di r1 e r2 rispettivamente in z1 e z2

-  si calcola il valore medio zw

 con

 

 che, nel caso di n1 = n2 , può essere semplificata in

 

-  Infine si trasforma zw in rw

con

 

Recentemente, sono stati proposti altri metodi, che dovrebbero dare stime più precise di rw.

 

 

ESEMPIO

a) Calcolare la significatività della differenza tra i due coefficienti di correlazione

-   r1 = 0,22 con n1 = 30 e

-   r2 = 0,31 con n2 = 50

b) Calcolare inoltre il coefficiente di correlazione ponderato rw.

 

Risposte

a)  Dopo aver trasformato r1= 0,22

 

 

 in z1 = 0,224

 e r2 = 0,31


 

 

in z2 = 0,321

-  si calcola l’errore standard della differenza z1-z2

 

 

 ottenendo = 0,24.

Da essi si ricava

 un valore di Z = -0,40.

Nella distribuzione normale bilaterale, poiché la domanda verte solo sulla significatività della differenza tra i due coefficienti di correlazione r1 e r2, a Z = -0,40 corrisponde una probabilità a = 0,689. Pure senza un’analisi della potenza del test, illustrata nel paragrafo successivo, la probabilità è così alta che si può concludere non esiste alcuna differenza tra i due coefficienti angolari.

 

Nel caso di un test unilaterale, rispetto alla procedura illustrata l’unica differenza consiste nella stima della probabilità a, non diversamente dal test t su due medie o due coefficienti angolari.

 

 

b)   Per ottenere il coefficiente ponderato rw, con

z1 = 0,224   e   n1 = 30

z2 = 0,321   e   n2 = 50

 

-  dapprima si stima zw

 

 

che risulta uguale a 0,286

-  infine con la trasformazione


 

 

si ricava rw = 0,278.

Il coefficiente di correlazione comune o ponderato tra

-   r1 = 0,22 con n1 = 30  e

-   r2 = 0,31 con n2 = 50

 è rw  = 0,278.

 

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007