VERIFICA DELLE IPOTESI

TEST PER UN CAMPIONE SULLA TENDENZA CENTRALE CON VARIANZA NOTA

E TEST SULLA VARIANZA

CON INTERVALLI DI CONFIDENZA

 

 

4.7.   INTERVALLO DI CONFIDENZA O DI FIDUCIA DI UNA MEDIA CON s2 NOTA

 

 

I tre metodi presentati in precedenza per valutare

-  la potenza (1-b) del test,

-  la stima delle dimensioni () minime del campione

-  il calcolo della differenza minima (d) significativa

 sono tra loro collegate nei concetti, nelle finalità e nelle formule da applicare.

Quando si programma un esperimento, le stime della potenza del test e delle dimensioni del campione hanno lo scopo specifico di indicare:

a)  quanti dati è necessario raccogliere, perché le analisi statistiche forniscano risultati accurati e attendibili, evitando che il campione sia troppo piccolo (quindi non significativo) o troppo grande (quindi con costi e tempi eccessivi, rispetto a quanto necessario);

b)  con quale probabilità i test statistici potranno dimostrare la presenza di un effetto con una dimensione predeterminata, nella situazione di variabilità supposta.

 

In questo contesto, la stima dell’intervallo di confidenza ha finalità integrative, in quanto è utile per

a)  implementare gli obiettivi,

b)  valutare le dimensioni (la media, la proporzione o la varianza) del parametro reale.

Inoltre, vari testi di statistica suggeriscono di utilizzare la stima dell’intervallo di confidenza anche per l’inferenza, in sostituzione dei test tradizionali bilaterali.

 

Come per la potenza, anche per capire i concetti sull’intervallo fiduciale o di confidenza occorre rifarsi alla teoria del campionamento. Se, da una popolazione teoricamente infinita e distribuita normalmente intorno alla media reale m, si estrae a caso un campione di  oggetti, a causa dell’errore di campionamento o variabilità casuale

-  la media campionaria  non avrà un valore identico alla media m della popolazione;

-  ma ogni media  di un nuovo campione avrà un valore diverso,

-  e la distribuzione di questi valori medi  avrà forma normale,

-  intorno alla media reale m

-  e con una dispersione determinata dall’errore standard .

 

Inversamente, ed è la situazione più frequente, dopo aver calcolato la media  di un campione è possibile stimare quale è la media m della popolazione. Anche in questo caso, l'inferenza classica o frequentista non risponde con una sola misura, quella fornita da uno stimatore puntuale, ma fornisce due valori (indicati con L1 e L2) che determinano

-  un intervallo, entro il quale si trova il valore del parametro alla probabilità a prescelta.

I due valori estremi sono detti limiti fiduciali o limiti di confidenza e comprendono l’intervallo di confidenza. Questo approccio serve anche per il test d’inferenza e fornisce esattamente le stesse conclusioni.

Per un test bilaterale,

-  se l’intervallo di confidenza alla probabilità 1- a contiene il valore espresso nell’ipotesi nulla H0 (di solito uguale a 0, ma può essere qualsiasi valore),

-  non esistono prove sufficienti per respingerla, ad una probabilità P < a.

Viceversa:

-  se l’intervallo di confidenza non lo contiene,

-  esistono elementi sufficienti per rifiutare l’ipotesi nulla H0, con una probabilità P < a.

Secondo alcuni autori, l’intervallo di confidenza rappresenta un approccio preferibile per interpretare i risultati di esperimenti, rispetto ai tradizionali test di ipotesi. Infatti fornisce anche un’idea della precisione della stima, che è funzione inversa dell’ampiezza dell’intervallo: a parità di altre condizioni, un intervallo di confidenza minore corrisponde a una stima più precisa.

 

Quando sia nota la varianza  della popolazione, a partire dalla media  di un campione

 mediante

m =

  si determinano i limiti di confidenza della media reale m.

 

Alla probabilità del 95%, con Z = 1,96 tale concetto è scritto come

 

 e significa:

- con probabilità del 95%

- la media m della popolazione si trova nell’intervallo compreso tra gli estremi individuati dalla media più o meno il prodotto di Z per l’errore standard.

In modo più semplice è scritta

m =

 

Per una probabilità del 99% è sufficiente sostituire 1,96 con 2,58

m =

 

ESEMPIO.  Da una popolazione con s = 3 e media reale m ignota, è stato estratto un campione di 10 dati, la cui media  è risultata uguale a 25. Calcolare l'intervallo di confidenza entro il quale si troverà la media della popolazione, alla probabilità del 99%.

 

Risposta.  Alla probabilità a = 0.01, in una distribuzione normale bilaterale corrisponde Z = 2,58.

Di conseguenza, con   = 25,   s = 3,    = 10,  

 si calcolano due valori

m =

 

- il limite inferiore L1 = 22,55 (25 – 2,45)

- il limite superiore L2 = 27,45 (25 + 2,45)

 per concludere con l’affermazione che, con probabilità del 99% di affermare il vero, la media reale m della popolazione si trova nell’intervallo compreso tra 22,55  e  27,45.


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007