Titolo

Il margine di errore nei sondaggi della consistenza elettorale di un partito piccolo

4 commenti (espandi tutti)

Buona domanda, confesso che ho preso la formula da qualche articolo, ma ora non ricordo la fonte... 

Può essere.
Comuque se si tratta di approsimare una binomiale con una normale la formula corretta è senza. Con un po' di esercizio si può ricavare in pochi passaggi, o più comodamente la si trova qui.

quel (n+4) deriva dall'applicazione di una correzione dovuta a E.B. Wilson quando p è molto vicino allo zero oppure a 1, "uno". In questi casi, infatti, l'intervallo di confidenza non sarebbe abbastanza accurato, sopratutto se il campione è piccolo. Si modifica la stima di p, con X+2/(n+4) , cioè si ipotizzano 4 prove fittizie in più, due di successo e due no.  Da qui la varianza p(1-p)/(n+4).  Il perché di questa correzione è piuttosto empirica. Sul link di wiki riportato da Leonardo, si cita Wilson, e lascia al lettore l'onere di rifare i passaggi per arrivare a determinare i parametri di distribuzione di p riportati nell'appendice di questo articolo.

E' meglio usare la formula di Wilson riportata daWikipedia con la correzione di continuità: p=(x+0.5)/n col + e p=(x-0.5)/n col meno.

Per le proprietà di copertura vedere

On frequency and efficiency measurements in counting experiments  Alberto Rotondi 

Nuclear Instruments and Methods Vol 614(2010)pag 105

(posso inviare materiale su richiesta)