TEST NON PARAMETRICI PER CORRELAZIONE, CONCORDANZA, REGRESSIONE MONOTONICA E REGRESSIONE LINEARE
21.10. LA REGRESSIONE LINEARE NON PARAMETRICA
Calcolata la retta di regressione con il metodo dei minimi quadrati, = a + b×Xi per la sua significatività è possibile ricorrere a test non parametrici, come illustrato in precedenza, quando si ha il sospetto che non siano state rispettate le condizioni di validità. E’ il caso in cui - i valori di Y non hanno una distribuzione normale (come succede per la presenza di uno o più valori anomali), - i dati della Y non hanno una varianza d’errore costante, cioè scarti uguali dalla retta, al variare delle X, - i dati sono espressi in percentuale e/o come rapporti rispetto a quantità fortemente variabili (quindi non hanno lo stesso intervallo fiduciale) oppure sono un punteggio (o comunque una scala di rango).
Resta sempre il problema che, con pochi dati, diventa impossibile dimostrare la normalità e omoschedasticità della distribuzione, se non già confermata da altre ricerche. In tale situazione di incertezza sulla non validità della regressione con il metodo parametrico dei minimi quadrati, è sempre conveniente, quando non necessario, calcolare una retta di regressione non parametrica.
Tra le metodologie, quella più diffusa è la proposta da H. Theil, pubblicata nel 1950 in tre articoli sullo stesso volume della rivista scientifica Indagationes Mathematicae. Successivamente, per la significatività sia del coefficiente angolare b sia dell’intercetta a, calcolati in qualsiasi modo, è possibile ricorrere a test non parametrici. Tra i più diffusi, è da ricordare il test di Theil (a distribution-free test for the slope coefficient), proposto con vari articoli a partire dal 1950, che può essere utilizzato per verificare: - la significatività di una retta b di regressione, con ipotesi nulla H0: b = 0 ed ipotesi alternativa H1 sia bilaterale che unilaterale; - la significatività della differenza tra una retta campionaria b ed un coefficiente angolare b0 atteso, con ipotesi nulla H0: b = b0 (prefissato) ed ipotesi alternativa H1 che anche in questo caso può essere sia unilaterale che bilaterale. Questa seconda situazione è semplicemente una generalizzazione del caso precedente. Le due metodologie sono quindi identiche, con la sola eccezione di un passaggio preliminare.
Un altro test utile all’inferenza sulle rette è il test di Hollander (a distribution-free test for the parallelism of two regression lines), proposto dalla seconda metà degli anni ’60, per verificare - il parallelismo tra due coefficienti angolari b1 e b2, e quindi l’ipotesi nulla H0: b1 = b2 e l’ipotesi alternativa sempre sia unilaterale che bilaterale.
Con altri test non parametrici sulla regressione lineare semplice, inoltre è possibile: - con il test di Maritz, valutare la significatività dell’intercetta a H0: a = a0 - con il test di Lancaster-Quade, verificare congiuntamente ed in modo indipendente la significatività sia di a sia di b nelle loro 3 combinazioni: (significatività sia di a che di b, solo di a, solo di b), - avere stime ed intervalli di confidenza per i parametri a e b.
Nella letteratura sulla regressione non parametrica, si trovano altri test, seppure attualmente meno diffusi nei programmi informatici e nei testi internazionali, per verificare le ipotesi precedenti. E’ possibile ricordare - il test di Brown e Mood, quello di Hajek, quello di Adichie e quello di Sievers, tutti sulla linearità e quindi alternativi al test di Theil; - altri test, proposti uno ancora da Brown e Mood e un altro ancora da Adichie, possono essere usati in alternativa a quello di Maritz; - inoltre Daniels, Konijn e Quade separatamente hanno proposto metodi alternativi a quello di Lancaster-Quade.
| |
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |