LA REGRESSIONE LINEARE SEMPLICE

 

 

16.4.   MODELLI DI REGRESSIONE

 

 

In seguito, dal suo significato originario di "ritornare indietro" verso la media e verso “la mediocrità”, il termine regressione assunse solo quello neutro di funzione che esprime matematicamente la relazione tra

-   la variabile attesa o predetta o teorica, indicata con Y, e

-  la variabile empirica od attuale, indicata con X.

 

La forma più generale di una equazione di regressione è

 dove il secondo membro è un polinomio intero di X.

 

L'approssimazione della curva teorica ai dati sperimentali è tanto migliore quanto più elevato è il numero di termini del polinomio:

-  in un grafico con n punti, una curva di grado n-1 passa per tutti i punti.

Ma il biologo e l’ambientalista non possono limitarsi alla ricerca della funzione matematica che meglio descrive i dati raccolti con un solo campione: devono soprattutto fornire una interpretazione logica del fenomeno, con argomenti e leggi tratti dalla disciplina.

 

Quasi sempre l'interpretazione dell’equazione di regressione è tanto più attendibile e generale quanto più la curva è semplice, come quelle di primo o di secondo grado. Regressioni di ordine superiore sono quasi sempre legate alle variazioni casuali; sono effetti delle situazioni specifiche del campione raccolto e solo molto raramente esprimono relazioni reali e permanenti, non accidentali, tra le due variabili.

Di conseguenza, tutti coloro che ricorrono alla statistica applicata nell’ambito della loro disciplina utilizzano quasi esclusivamente regressioni lineari (di primo ordine) o le regressioni curvilinee più semplici (di secondo ordine).

 

 

     

                                relazione lineare positiva                                                       relazione lineare negativa

 

 

 

     

relazioni quadratiche

 


 

La regressione lineare, che rappresenta la relazione più semplice e frequente tra due variabili quantitative, può essere positiva o negativa:

-  nel primo caso, all’aumento dei valori di una variabile corrisponde un aumento anche nell’altra;

-   nel secondo, all’aumento dell’una corrisponde una diminuzione dell’altra.

 

Oltre alle forme a parabola rappresentate in questi grafici, la regressione curvilinea di secondo grado può seguire vari altri modelli, come l’iperbole, l’esponenziale e la logaritmica. Sono fenomeni frequenti in natura e semplici da interpretare: una sostanza può determinare effetti positivi a dosi basse ed effetti fortemente decrescenti oppure stabili a dosi in aumento.

 

 

 

     

                                      relazione cubica                                                                      nessuna relazione

 

 

 

Le curve e le relazioni cubiche (di terzo ordine) e quelle di ordine superiore rappresentano rapporti tra due variabili che sono eccessivamente complessi per un fenomeno naturale o comunque biologico. Ad esempio, come suggerisce la prima delle due ultime figure riportate (relazione cubica), è molto raro trovare una sostanza che

-   a dosi crescenti determina una contrazione della seconda variabile nelle fasi iniziali,

-   per causare un suo aumento in una seconda fase e

-   successivamente una nuova diminuzione, continuando sempre ad aumentare la dose.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007