VERIFICA DELLE IPOTESITEST PER UN CAMPIONE SULLA TENDENZA CENTRALE CON VARIANZA NOTAE TEST SULLA VARIANZA CON INTERVALLI DI CONFIDENZA
4.9. STIMA DELLA MEDIA CON UN INTERVALLO DI CONFIDENZA PREFISSATO O CON UN ERRORE PREFISSATO, NEL CASO DI VARIANZA NOTA
In varie situazioni si richiede di ricavare, da dati campionari, una stima della media reale che abbia un errore non maggiore di quanto prestabilito, naturalmente alla probabilità a prefissata che tale affermazione sia vera. Ad esempio, nella ricerca industriale è possibile chiedersi quale sia la quantità media di principio attivo in un prodotto di una ditta concorrente; nella ricerca ambientale, quale sia la quantità effettiva di una sostanza inquinante in un corso d’acqua. Ovviamente la risposta deve essere non vaga ma utilizzabile a fini pratici. Deve permettere il confronto con altri prodotti che hanno quantità note di principio attivo; deve consentire di decidere, con una probabilità minima di errare, se i limiti di legge sono stati rispettati oppure superati.
Quindi la media calcolata deve essere precisa, in altri termini deve avere un intervallo di confidenza piccolo. Purtroppo, quando la variabilità dei dati è molto grande e il campione raccolto è piccolo, spesso viene fornito un intervallo troppo grande, in quanto la raccolta dei dati non è stata finalizzata correttamente. Ad esempio, per un confronto con m = 25 non è raro imbattersi in stime del tipo alla probabilità a = 0.05. Con misure così approssimate, non è più possibile decidere se il valore reale superare ampiamente il valore di confronto perché è 40 (25 + 15) oppure ne è molto lontano, in quanto è 5 (20 - 15). Spesso si richiede
che la misura abbia un errore di 1 oppure 2 unità, ovviamente alla probabilità a desiderata. Prima
della raccolta dei dati, occorre quindi sapere quale deve essere la dimensione
minima (
La metà
dell’intervallo di confidenza di una media con varianza s2 nota, quindi la
quantità ( è Da essa si ricava e infine Da questa ultima formula si deduce che, - per calcolare
il numero minimo ( - la varianza
della popolazione - la probabilità o rischio
- l’errore
massimo accettabile (
Inoltre, risultano con evidenza due concetti. 1) Può sembrare illogico, ma non serve conoscere la media. L'errore massimo accettabile d deve essere fornito in termini assoluti, anche se ovviamente nella sua interpretazione e determinazione lo scarto massimo in percentuale rispetto media è importante; tanto che in vari prodotti industriali il campo di variazione del la quantità presente in ogni confezione è media ± x %; ad esempio, grammi 55 ± 10%. 2) Non esiste l’errore b, in quanto non si effettua un test di confronto con un’altra media, ma solo una stima precisa della media vera.
ESEMPIO. Il responsabile delle analisi chimiche in un’azienda, per un controllo periodico, deve fornire una stima della quantità di principio attivo presente in un prodotto. La lunga esperienza nel campo e le numerose analisi già condotte gli hanno già permesso di sapere che la varianza vera della quantità di quel principio attivo è s2 = 8,42. Quante analisi deve
effettuare, in modo che la media
Risposta. Con i dati del problema s2 = 8,42
è uguale a 33. In questa valutazione,
ha un peso rilevante l’errore massimo
E’ importante anche
il valore della probabilità a; ma ha un effetto minore sul valore di Precisamente, con a = 0.01 quindi con un quinto della probabilità precedente di errare, alla quale corrisponde il valore Z = 2,5758
il risultato
sarebbe stato La dimensione minima del campione è aumentata del 70% rispetto alla stima precedente. Il valore di s2 non deve essere scelto, ma deve essere noto. Esso non dipende dal ricercatore, ma solo dal ciclo produttivo. E’ tipico di ogni variabile naturale e di ogni prodotto industriale.
| |
Manuale di Statistica per la Ricerca e la Professione © Lamberto Soliani - Dipartimento di Scienze Ambientali, Università di Parma (apr 05 ed) ebook version by SixSigmaIn Team - © 2007 |