LA REGRESSIONE LINEARE SEMPLICE
16.10. INTERVALLI DI CONFIDENZA DEI PARAMETRI b E a
L’uso della retta di regressione a fini predittivi richiede che possa essere stimato l’intervallo di previsione (prediction interval) - del coefficiente angolare b - dell’intercetta a.
I limiti di
confidenza sono utili anche per eventuali confronti con un parametro
prefissato e quindi ai fini dell’inferenza, come già illustrato per la media
campionaria
Un qualsiasi valore
campionario - quando non
sono compresi entro i limiti di limiti di confidenza di un coefficiente
angolare - sono significativamente differenti da esso. Questa analisi è
del tutto analoga a quella del test Come per la media, - conoscendo - è possibile
determinare l’intervallo di confidenza dei valori campionari attraverso la
distribuzione normale ridotta
In realtà, nella
ricerca quasi sempre il procedimento logico è effettuato nella direzione
opposta: si cerca di stimare il parametro della popolazione ( Ricavato un valore - i limiti dell’intervallo di confidenza tra il limite inferiore L1 e il limite superiore L2 con L1 = L2 = spesso scritto più rapidamente come b = dove -
Per l'intercetta campionaria ( si trova entro l’intervallo a = dove -
con -
ESEMPIO 1. Ricorrendo agli stessi dati su altezza e peso, con i quali sono stati calcolati la retta e la sua significatività, si è ottenuto
t(5,0.025)
= 2,571 t(5, 0.005) = 4,032 a = -73,36
Stimare A) l’intervallo di confidenza del coefficiente angolare b B) l’intervallo di confidenza dell’intercetta a. alla probabilità a = 0.05 e a quella a = 0.01
Risposta. A) L'intervallo di confidenza del coefficiente angolare b con la formula 1 - alla probabilità del 95% è
cioè - il limite inferiore è - il limite superiore è
2 - probabilità del 99% è
cioè - il limite inferiore è - il limite superiore è
B) L'intervallo di confidenza per l'intercetta a con la formula 1 - alla probabilità del 95% è
cioè - il limite inferiore è - il limite superiore è
2 - probabilità del 99% è
cioè - il limite inferiore è - il limite superiore è
Anche in queste
applicazioni, come già evidenziato per la media della popolazione (m) rispetto alla
media campionaria ( Per semplicità
didattica e come aiuto ai calcoli richiesti dalle formule, è stato utilizzato
un numero di dati molto limitato, nettamente inferiore a quello che si usa
nella ricerca. Di conseguenza, i parametri della retta hanno intervalli molto
ampi; tale risultato è particolarmente evidente per l’intercetta Inoltre, come in
molte variabili biologiche, la varianza è grande e quindi l’intervallo di
confidenza dell’intercetta
ESEMPIO 2. Ricorrendo ai dati sulla concentrazione e l’intensità della fluorescenza, con i quali è stata calcolata la retta e verificata la sua significatività nei paragrafi precedenti, stimare A) l’intervallo di confidenza del coefficiente angolare b B) l’intervallo di confidenza dell’intercetta a. alla probabilità a = 0.05.
Risposta. Dai paragrafi precedenti, si rileva
t(5,0.025)
= 2,571 a = 1,5
A) L'intervallo di confidenza del coefficiente angolare b con la formula
alla probabilità del 95% è
cioè - il limite inferiore è - il limite superiore è
B) L'intervallo di confidenza per l'intercetta a con la formula alla probabilità del 95% è
cioè - il limite inferiore è - il limite superiore è
Anche nell’intervallo di confidenza si evidenzia come impiegando misure chimiche, che hanno una variabilità molto bassa, gli intervalli di confidenza forniscano stime molto precise dei parametri della regressione. Per capire esattamente il significato dell’intervallo di confidenza del coefficiente angolare b (confidence interval for the regression coefficient; confidence limits for the slope of the regression line), è utile osservare la figura seguente. Essa non è riferita a nessuno degli esempi precedenti, ma evidenzia come - i vari
possibili
E’ importante
ricordare un altro aspetto: in questo intervallo è in discussione solamente
il valore reale di
L’intervallo di
confidenza di tutta la retta, che ovviamente considera
simultaneamente l’intervallo di confidenza di
Un altro concetto importante è - il significato
esatto dell’intervallo di confidenza del coefficiente angolare Può essere spiegato con semplicità, attraverso un esempio. L’intervallo di confidenza al 95% significa che vi è - una
probabilità non maggiore del 5% che il coefficiente angolare reale
| ||||
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |