LA REGRESSIONE LINEARE SEMPLICE

 

 

16.8.  TEST PER LA SIGNIFICATIVITA DELL’INTERCETTA

 

 

In varie situazioni,  oltre alla significatività del coefficiente angolare , spesso è importante verificare la significatività dell'intercetta .  Si utilizza un test  che, anche in questo caso, può essere effettuato

 

1 -  sia rispetto a zero, quando si presuppone che la retta debba passare per l’origine degli assi e quindi con X = 0 si abbia necessariamente Y = 0;

in questo caso, si verifica l’ipotesi nulla

H0: a = 0

 

2 - sia rispetto a un qualsiasi valore atteso o prefissato a0, eventualmente stimato in un altro esperimento;

in questo caso, si verifica l’ipotesi nulla

H0: a = a0

 dove

a è il valore della popolazione dalla quale è stato estratto il campione con intercetta .

L’ipotesi alternativa H1 può essere

bilaterale, quando non si conosce la direzione della differenza ed entrambe sono accettabili,

unilaterale, quando la differenza può essere solo positiva oppure solo negativa.

 

Prima di verificare la significatività statistica, come già discusso nel paragrafo precedente, è bene vagliare il significato disciplinare di . Ad esempio,

-  con i dati biologici dell’esempio precedente (altezza e peso in studentesse), l’intercetta è priva di significato reale, in quanto non esiste nessuna ragazza con altezza 0; pertanto  è solo una costante che serve per calcolare la retta;

- con i dati chimici (concentrazione e fluorescenza), l’intercetta è la quantità di fluorescenza quando la concentrazione della sostanza è uguale a 0; quindi rappresenta l’intensità di fondo della fluorescenza.


 

Il test per la significatività di  è effettuato mediante la stima di un valore  con gdl n-2 (è fondato sulla varianza d’errore della retta).

Il  è stimato con

 dove

-    è l'errore standard dell'intercetta

 ed è calcolato come

con

 che indica la varianza d’errore della retta

(già utilizzata per stimare la significatività del coefficiente angolare ).

 

 

ESEMPIO 1.  Utilizzando gli stessi 7 dati della relazione peso - altezza, in cui

       = 16,101       = 7       = 510       

 stimare se l'intercetta  si discosta in modo significativo da zero.

 

Risposta.  Per verificare l’ipotesi nulla

H0: a = 0

 con ipotesi alternativa

H1: a ¹ 0

 poiché l’errore standard di  

 è uguale a 30,599

 si ottiene un valore del t di Student

 uguale a -2,397 con 5 df.


Per un test bilaterale, il valore critico di t con 5 df alla probabilità a = 0.05 è uguale a 2,571.

Di conseguenza, l'intercetta calcolata non risulta significativamente diversa da zero.

In realtà, il valore è così vicino alla significatività che con un numero maggiore di dati molto probabilmente il test sarebbe risultato significativo.

Con dati biologici, come in questo esempio, l’errore standard di  spesso è molto grande. In particolare, come evidenzia la formula,

 

 

 quando la media  è grande e quindi è lontana dall’origine degli assi.

 

Un secondo aspetto importante è che, per una interpretazione meno affrettata del risultato, sarebbe sempre utile

-  stimare la potenza del test effettuato (vedi paragrafo successivo)

 prima di affermare con sufficiente sicurezza che il coefficiente angolare  e/o l’incetta , come in questo caso, non sono significativi.

 

 

ESEMPIO 2. Con le misure di fluorescenza delle 7 concentrazioni (pg/ml)

 

 

Concentrazione

0

2

4

6

8

10

12

Fluorescenza     

2,1

5,0

9,0

12,6

17,3

21,0

24,7

 

 

 con le quali è stata ricavata la retta

 valutare se l’intercetta  = 1,5 è significativamente maggiore di 0.

 

Risposta. Il test è unilaterale, in quanto si vuole verificare se con questo metodo è presente una intensità di fluorescenza di base.


Le ipotesi che si vogliono verificare sono

            contro           

 A questo scopo,

 con la formula

 dove

-  = 1,5  e   = 0

 e, prendendo i valori dai paragrafi precedenti in cui sono utilizzati gli stessi dati,

 = 0,188        = 7          = 6         = 112

 si ottiene

 

 

 il valore  = 5,08 con 5 gradi di libertà.

Poiché in una distribuzione unilaterale alla probabilità  = 0.005 il valore critico di  con 5 gdl è uguale a 4,0322

 - si rifiuta l’ipotesi nulla, con probabilità di errare P < 0.005.

Esiste una fluorescenza di fondo, statisticamente molto significativa.

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007