VERIFICA DELLE IPOTESI

TEST PER UN CAMPIONE SULLA TENDENZA CENTRALE CON VARIANZA NOTA

E TEST SULLA VARIANZA

CON INTERVALLI DI CONFIDENZA

 

 

4.9.    STIMA DELLA MEDIA CON UN INTERVALLO DI CONFIDENZA PREFISSATO  O  CON UN ERRORE PREFISSATO, NEL CASO DI  VARIANZA  NOTA

 

 

In varie situazioni si richiede di ricavare, da dati campionari, una stima della media reale che abbia  un errore non maggiore di quanto prestabilito, naturalmente alla probabilità a prefissata che tale affermazione sia vera. Ad esempio, nella ricerca industriale è possibile chiedersi quale sia la quantità media di principio attivo in un prodotto di una ditta concorrente; nella ricerca ambientale, quale sia la quantità effettiva di una sostanza inquinante in un corso d’acqua. Ovviamente la risposta deve essere non vaga ma utilizzabile a fini pratici. Deve permettere il confronto con altri prodotti che hanno quantità note di principio attivo; deve consentire di decidere, con una probabilità minima di errare, se i limiti di legge sono stati rispettati oppure superati.

 

Quindi la media calcolata deve essere precisa, in altri termini deve avere un intervallo di confidenza piccolo. Purtroppo, quando la variabilità dei dati è molto grande e il campione raccolto è piccolo, spesso viene fornito un intervallo troppo grande, in quanto la raccolta dei dati non è stata finalizzata correttamente.

Ad esempio, per un confronto con m = 25  non è raro imbattersi in stime del tipo

 alla probabilità a = 0.05.

Con misure così approssimate, non è più possibile decidere se il valore reale superare ampiamente il valore di confronto perché è 40 (25 + 15) oppure ne è molto lontano, in quanto è 5 (20 - 15).

Spesso si richiede che la misura abbia un errore di 1 oppure 2 unità, ovviamente alla probabilità a desiderata. Prima della raccolta dei dati,  occorre quindi sapere quale deve essere la dimensione minima () del campione. E’ possibile risolvere questo problema, utilizzando in modo leggermente differente i concetti già impiegati nel calcolo dell’intervallo di confidenza.

 

La metà dell’intervallo di confidenza di una media con varianza s2 nota, quindi la quantità () compresa tra la media e il limite inferiore oppure tra la media e quello superiore trattandosi di due quantità sempre uguali e simmetriche intorno alla media,

è

Da essa si ricava

 e infine

Da questa ultima  formula si deduce che,

-  per calcolare il numero minimo () di dati, utile allo scopo di avere una media campionaria con un errore massimo prefissato () rispetto a quella reale,  prima occorre definire tre quantità:

- la varianza della popolazione ,

- la probabilità o rischio  che tale affermazione non si dimostri vera,

- l’errore massimo accettabile () in valore assoluto o scarto massimo dalla media vera.

 

Inoltre, risultano con evidenza due concetti.

1) Può sembrare illogico, ma non serve conoscere la media. L'errore massimo accettabile d deve essere fornito in termini assoluti, anche se ovviamente nella sua interpretazione e determinazione lo scarto massimo in percentuale rispetto media è importante; tanto che in vari prodotti industriali il campo di variazione del la quantità presente in ogni confezione è media ± x %; ad esempio, grammi 55 ± 10%.

2) Non esiste l’errore b, in quanto non si effettua  un test di confronto con un’altra media, ma solo una stima precisa della media vera.

 

 

ESEMPIO. Il responsabile delle analisi chimiche in un’azienda, per un controllo periodico, deve fornire una stima della quantità di principio attivo presente in un prodotto. La lunga esperienza nel campo e le numerose analisi già condotte gli hanno già permesso di sapere che la varianza vera della quantità di quel principio attivo è s2 = 8,42.

Quante analisi deve effettuare, in modo che la media  da lui calcolata abbia uno scarto non superiore a 2 punti rispetto alla media reale m, con una probabilità del 95% che quanto afferma sia vero?

 

Risposta. Con i dati del problema

s2 = 8,42       = 1,96       = 2

 il numero  minimo di analisi

 

 

 è uguale a 33.

In questa valutazione, ha un peso rilevante l’errore massimo  che si vuole commettere. Infatti è semplice osservare che se l’errore massimo fosse stato la metà (1 punto) di quello utilizzato (2 punti), si sarebbe stimato un  numero minimo quadruplicato ( = 130, a causa di arrotondamenti).

 

E’ importante anche il valore della probabilità a; ma ha un effetto minore sul valore di .

Precisamente, con a = 0.01 quindi con un quinto della probabilità precedente di errare, alla quale corrisponde il valore Z = 2,5758

 

 il risultato sarebbe stato  = 56.

La dimensione minima del campione è aumentata del 70% rispetto alla stima precedente.

Il valore di s2 non deve essere scelto, ma deve essere noto. Esso non dipende dal ricercatore, ma solo dal ciclo produttivo. E’ tipico di ogni variabile naturale e di ogni prodotto industriale.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Manuale di Statistica per la Ricerca e la Professione  © Lamberto Soliani   - Dipartimento di Scienze Ambientali, Università di Parma  (apr 05 ed)  ebook version by SixSigmaIn Team  - © 2007