CORRELAZIONE  E  COVARIANZA

 

 

18.5.   POTENZA A PRIORI E A POSTERIORI PER LA SIGNIFICATIVITA’ DI r

 

 

Le due ipotesi nulle 

H0: r = 0   che indica che il valore reale di correlazione del campione è uguale a 0

-  H0: r = r0 che indica che il valore reale di correlazione del campione è uguale a un valore r qualsiasi, di norma diverso da 0

sono rifiutate correttamente quando nella realtà

r ¹ 0      oppure       r ¹ r0

 il valore vero di r è diverso da 0 (zero).

Ma, in tali condizioni, la distribuzione è asimmetrica, come visto anche nella figura con l'ultimo esempio.

 

Pertanto, per il calcolo della potenza 1-b in un test di significatività del coefficiente di correlazione r, è necessario ricorrere alla trasformazione di r in z di Fisher.

I metodi di stima di 1-b presentano alcune differenze se

A)  l’ipotesi nulla è  H0: r  =  0

B)  l’ipotesi nulla è  H0: r  =  r0

 

A)  Nel primo caso, nella verifica dell’ipotesi H0: r = 0, la stima della potenza a posteriori 1-b è ottenuta dalla relazione:

dove

 è il valore che, nella distribuzione normale unilaterale, permette di ricavare direttamente (senza trasformazione) la probabilità b;

 è il valore critico di r, da prendere in una delle due tabelle dei valori critici di r,  per la probabilità a prefissata in una distribuzione bilaterale o unilaterale e con df n = n – 2, trasformato in z con la formula di Fisher;

 è il valore di r sperimentale, trasformato in z con la formula di Fisher;

 è il numero di coppie di dati,  con i quali è stato calcolato r,

-  ricordando che sia il valore critico di r sia il valore sperimentale di r devono essere trasformati con la solita formula

 

Sempre per rifiutare l’ipotesi nulla H0: r = 0 quando il valore atteso è r0 ¹ 0,

 la potenza a priori o numero minimo n di dati perché il valore campionario r sia significativo

 è

 dove

 e  sono i valori di z nella distribuzione normale per le probabilità  a e b (senza trasformazione di Fisher),

 (zeta greca minuscola) è il valore  atteso, trasformato in z secondo Fisher.

 

ESEMPIO 1. (PER L'IPOTESI H0: r = 0)    Con 20 dati è stato calcolato un valore di r = 0,35 che non è risultato significativamente diverso da zero, alla probabilità a = 0.05. Infatti, nelle due tabelle relative è semplice osservare che il valore critico alla stessa probabilità a = 0.05 in un test bilaterale con df = 18  è 0,4438.  Si chiede:

a) quale è la potenza di questo test?

b) quante coppie di dati(n) occorre raccogliere, per rifiutare l’ipotesi nulla H0: r = 0 nel 90% dei casi, al livello di significatività del 5%?

 

Risposte.

Per il primo caso,

a) Applicando la formula

dove

 è il valore nella distribuzione normale unilaterale che permette di ricavare direttamente la probabilità b;

 è il valore sperimentale di r (uguale a 0,35), che trasformato in z con il metodo di Fisher

 


 

 risulta uguale a 0,365

 

 è il valore critico di r, alla probabilità a = 0.05 bilaterale con n = n - 2 = 18 (nella tabella relativa è 0,4438); trasformato in z con il metodo di Fisher

 

 

 risulta uguale a 0,477.

 

Con i dati dell’esempio,

  risulta uguale a 0,46.

 

Nella distribuzione normale unilaterale, ad essa corrisponde una probabilità b = 0,323. Il segno indica solo la coda della distribuzione.

Di conseguenza, la potenza 1-b del test è 1-0,323 = 0,677 o 67,7%

 

 

b)  Per stimare quanti dati n sono necessari per un test con b = 0.10 e a = 0.05 bilaterale, affinché un valore atteso di r = 0,35 risulti significativamente diverso da zero,

 usando la formula

 dove con

 = 1,28 (in una distribuzione normale unilaterale per una probabilità uguale a 0.10),

 = 1,96 (in una distribuzione normale bilaterale per una probabilità uguale a 0.05),

 = 0,365 ottenuto dalla trasformazione di r = 0,35

 mediante

 si ottiene

 un valore di n = 81,8. E’ necessario rilevare almeno 82 coppie di dati.

 

 

Nel secondo caso, quando l’ipotesi nulla è  H0: r = r0 dove r0 ¹ 0,

 la formula per calcolare la potenza a posteriori 1-b è leggermente più complessa di quella precedente, diventando

 dove, mantenendo uguali gli altri parametri,

-   in

-   z è il valore campionario di r trasformato in z con la formula di Fisher

-    (zeta greca minuscola) è  la stessa trasformazione del valore r0 atteso o ipotizzato,

ricordando che i tre valori entro parentesi, cioè (1) il valore sperimentale di r, (2) il valore atteso o teorico di confronto r0,  (3) il valore critico di r con df n-2 devono essere trasformati con la formula di Fisher.

 

 

ESEMPIO 2  (PER L'IPOTESI  H0: r = r0  DOVE  r0 ¹ 0)    La correlazione  tra le variabili X1 e X2  è stata valutata in r = 0,15. Con 100 dati, un ricercatore ha calcolato r = 0,35 e ha motivo di credere che, nella nuova condizione sperimentale, la correlazione sia significativamente maggiore.

Calcolare la potenza del test, per una significatività a = 0.05.

 

Risposta

1)  Con r = 0,35 il valore di z

 

 

 è uguale a 0,365.

 

2)  Con r0 = 0,15 il valore di  


 

 

 è  uguale a 0,151,

 

3) Il valore critico di r alla probabilità a = 0.5 in una distribuzione unilaterale con df = 98 non è riportato nelle 2 tabelle specifiche. Per interpolazione tra 0,168 con df 95  e  0,164 con df 100 può essere stimato uguale a 0,165. Da esso si ricava

 il valore di  

 

 

 che risulta uguale a 0,166.

 

4) Da questi tre valori e con n = 100, si ottiene

 

 

 un valore di = 0,47

In una distribuzione normale unilaterale, a z = 0,47 corrisponde una probabilità di 0,316.

Con questi dati, il valore di b è uguale a 0,316 e la potenza 1-b del test richiesto è 1-0,316 = 0,684.

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007