Statistica ed elezioni.

Antonio.114
Salve,scrivo con un sito di sondaggi ed elezioni e vorrei chiedervi consiglio su di una questione.
Mi riferisco ai brogli del 2006 alle politiche che secondo l'inchiesta di Deaglio sarebbero stati compiuti dal CDX.
A parte la questione dei sondaggi diversi dai risultati e delle schede bianche molto diminuite Deaglio sosteneva
che la prova dei brogli era questo grafico che si riferisce ai dati dello scrutinio:

E'un grafico progressivo lineare che si riferisce ai dati come furono forniti dal ministero degli interni,che allora per la prima volta permetteva anche ai cittadini di poter seguire lo spoglio sul sito internet.
Sull'asse verticale ci sono le percentuali delle 2 coalizioni e su quello orizzontale il numero delle sezioni man mano scrutinate.
Il primo punto vuol dire che con 7122 sezioni scrutinate il CSX aveva il 54% dei voti ed il CDX il 45,5%.
Poi questo grafico si aggiorna ad intervalli di variabili di 1000 o 2000 sezioni ed evidenzia come il CSX sia sceso in continuazione ed il CDX invece salito in maniera speculare.
Questo sarebbe la prova di un broglio,per vari motivi.
Ad esempio mi pare che Odifreddi dicesse nel suo libro IL MATEMATICO IMPENITENTE che per la legge dei grandi numeri
a metà di uno spoglio i dati delle coalizioni dovrebbero essere cristallizzati e non variare più fino alla fine se non di pochi decimi.
Invece a metà dello spoglio nel 2006 il CSX aveva ancora un buon vantaggio sul CDX,del 52% contro il 47.5% circa.
E quello avrebbe dovuto essere il risultato finale,invece in maniera anomala il CSX continuò a scendere ed il CDX a salire fino al famoso 49,8% a 49,7% finale delle coalizioni alla camera.
La cosa colpì allora anche me,però mi ricordai che anche nel 2001 al senato era accaduto qualcosa di simile.
All'inizio dello spoglio il CSX di Rutelli era al 42% circa ed il CDX al 38%.
Però il risultato finale al senato allora fu del 42,5% al CDX ed il 38,7% al CSX.
Se non ricordo male a scoprire l'inghippo fu l'ex-radicale passato in Forza Italia Calderisi.
Lui informandosi meglio vide che nella prima fase dello spoglio erano arrivati più dati dalle regioni rosse rispetto alle altre.
Cioè dove la sinistra è più forte erano più avanti nello spoglio,mentre nel sud dove invece era il CDx ad andare meglio erano
più indietro.
Nel 2006 ricordandomi del 2001 credetti quindi che fosse avvenuto qualcosa di simile.
Passiamo al 2008 quindi,per vedere come vanno le cose.
Ebbene quando arrivai a casa dal lavoro al pomeriggio erano state scrutinate mi pare 7-8000 sezioni.
Il CDX era si in vantaggio,ma solo col 43% contro il 41,5% circa del CSX.
E mi pare che nel corso dello scrutinio anche nel 2008 come nel 2006 il CDX crescerà di circa 4 punti fino al 46,8% finale
ed invece il CSX calerà a sua volta di 4 punti fino al 37,5%.
Stessa musica nel 2013.
Alle prime 7-8000 sezioni il CSX di Bersani ha il 33% ed il CDX il 25%.
Però poi si riequilibrano fino al 29,5% a 29,2% finale.
Qui ho pure provato a fare un grafico:

Che mi pare sia simile a quello del 2006.
Pure alle europee del 2014 all'inizio dello spoglio il PD di Renzi era al 45%,ma poi è sceso fino al 40,8% finale.
Ed il suo dato non si è stabilizzato a metà dello spoglio.
Ha continuato sempre a calare.
Per dire dopo la metà dello spoglio era ancora sul 42-42,5%,ma continuava a calare.
Guardando le singole circoscrizioni si poteva vedere che mentre il centro ed il nord avevano quasi finito lo spoglio
il sud e le isole avevano invece passato la metà.
Ed al nord il PD ha preso il 40%,al centro quasi il 47 mentre al sud e nelle isole è solo sul 35%.
Per questo penso che sia continuato comunque a calare.
Perchè nelle sezioni che rimanevano da scrutinare era più debole di quelle che avevano finito prima lo spoglio.
Ho quindi concluso che quella di Deaglio fosse una sciocchezza.
L'andamento col CSX che cala e col CDX che cresce per tutta o quasi la durata dello spoglio c'è sempre stato,
ce ne siamo accorti solo nel 2006 perchè è dal 2006 che tutti possono seguire su internet lo spoglio quasi in tempo reale
e poi ha anche la sua spiegazione,e cioè che arrivano prima più dati dalle regioni in cui la sinistra è più forte.
Però l'altro giorno un bloggher mi fa notare che i brogli secondo lui ci sono stati nel 2006,e per farlo mi mostra 2 grafici,
il primo questo:
[img]http://iltafano.typepad.com/.a/6a00d83451654569e201a511d4fb65970c-500wi[/img]
Dovrebbe essere un grafico lineare progressivo come il primo che ho postato,relativo all'andamento dei dati del 2006.
La differenza è che questo è diviso ad intervalli di 6000 sezioni alla volta.
Il primo punto dà infatti il 54% al CSX ed il 45,5% al CDX.
Fino ad arrivare a quasi il 50% ciascuno.
E fino a qui niente di nuovo.
Poi lui di grafico me ne mostra un altro,questo:
[img]http://iltafano.typepad.com/.a/6a00d83451654569e201a3fd245127970b-320wi[/img]
E'sempre relativo al 2006,ma questa volta i gruppi da 6000 sezioni(i decili)non sono più progressivi,ma ogni punto si riferisce alle percentuali prese dai poli in quel singolo intervallo.
Ad esempio l'ultimo punto vuol dire che dalla sezioni 54001 alla 60000 il CDX ha preso il 56% circa ed il CSX solo il 46%.
Praticamente partendo nelle prime 6000 sezioni dal 54% al CSX ed il 45% al CDX in ogni singolo decile il CSX ha ottenuto
percentuali via via più basse,mentre il CDX viceversa sempre più alte.
E questo per il mio interlocutore è la prova di un broglio perchè le probalitità che si avveri una tale sequenza sono secondo
lui inferiori a quelle di poter vincere al supernalotto.
Debbo dire che non essendo pratico di statistica non avevo mai affrontato la questione da questo punto di vista.
Così su 2 piedi pensandoci sarei portato a credere però che alla fine non sia comunque così strano.
Se infatti per ultimi arrivano i dati dalla sicilia o dalle zone dove in genere il CDX è più forte ecco che anche
un grafico a decili non progressivi non sarebbe così strano.
Per tagliare la testa al toro andate su questo link:
http://www.webalice.it/marisa.pareto/se ... utinio.htm
Questo è il sito di Marisa Pareto,che nel 2006 se non sbaglio discusse su questo Forum con Lupo Grigio
sostenendo la tesi dei brogli.
Ebbene la sosteneva anche nel 2008.
Lei nella tabella del link riferita allo spoglio progressivo del senato dice di vedere lo stesso andamento anomalo del 2008.
Questa tabella è riferita ai soli PD e PDL al senato e non alle intere coalizioni,però lei osserva che il PDL passa nel 2008
dal 33,7% delle prime 3703 sezioni al 38,1% finale ed il PD dal 38,1% al 33,7%.
Praticamente si sono scambiati le posizioni.
Io ho provato a fare un grafico lineare progressivo diviso a gruppi di 6000 sezioni e ci è uscito questo:

Mi pare identico nell'andamento ai lineari progressivi del 2006.
Ora vi chiedo,un grafico lineare progressivo di questo genere,ha per forza un equivalente grafico lineare a decili singoli
come quello del 2006 oppure no ?
Cioè perchè nel 2008 il PD ed il PDL si scambino le posizioni partendo dal 38,1 e 33,7 rispettivamente per poi invertirle alla fine bisogna che per forza anche allora il PD abbia preso decile dopo decile percentuali sempre minori ed il PDL al contrario percentuali sempre maggiori ?
Se così fosse l'evento poco probabile si sarebbe invece ripetuto almeno un'altra volta.
Cioè se ad un certo punto nei singoli decili non ci fosse più la tendenza che un partito prende sempre una percentuale minore e l'altro sempre maggiore allora il grafico lineare ma progressivo relativo a quella elezioni non dovrebbe avere un'altra forma ?
Chessò un'iperbole anzichè due linee quasi rette.
(tenete presente che seguo si le elezioni da 20 anni,ma non sono molto pratico di statistica e non vorrei avere scritto delle inesattezze)
Grazie del tempo che vorrete dedicarmi per chiarirmi questo dubbio.

Risposte
marisa13
all'inizio si vedeva bene ma ora l'immagine è piccola

Antonio.114
Dunque per te nel 2008 con 22076803 voti validi per 38529 sezioni scrutinate vi è una media di 573 voti validi.
A fine scrutinio con 36527230 voti validi per 61212 sezioni la media sale a 597.
Avendo il dato delle 1427023 schede nulle e bianche finali,sempre per 61212 sezioni,ecco una media di 23 voti nulli per seggio.
Dividendo poi i 37954253 voti assoluti per le 61212 sezioni ecco la media di 620 voti assoluti totali per sezioni.
E fin qua siamo d'accordo,sono dati ufficiali.
Dove ci separiamo è come tu calcoli i voti assoluti parziali,e di conseguenza il numero di nulle parziali a 38529 sezioni.
Tu moltiplichi 620 per 38529 ed ottieni 23887980 voti assoluti a quel punto.
Sottraendovi i 22076803 voti validi ufficialmente registrati arrivi ad avere già 1800000 schede non valide a solo 38000 sezioni.
Ma questa è la solita forzatura di applicare in maniera stringente le statistica laddove invece non ve ne sono invece le condizioni.
Come nel caso della diversità di bianche tra senato e camera o con i grafici presunti impossibili con il trend di scrutinio.
Non puoi usare come moltiplicatore 620 per le prime 38529 sezioni,in quanto 620 è la media totale,di tutte e 61212
le sezioni.
Tu la fai troppo facile,dovresti calcolare molti più fattori che invece non fai.
E' chiaro che nella prima fase di uno spoglio arrivino quasi tutte le sezioni piccole,mentre nella seconda arrivino invece
le sezioni più grosse.
E le differenze di grandezza tra sezioni e sezioni ci sono.
Quindi nell'intervallo delle prime 38529 sezioni per sapere i votanti non puoi usare il moltiplicatore medio finale,620,
perché così ottieni un dato sballato,infatti con 38529 sezioni tu calcoli che nel 2008 ci fossero state già 1,8 milioni
di nulle,quando invece furono solo 1,4 milioni,ma a fine spoglio delle 61212 sezioni.
No,la verità è un altra è cioè che nelle prime 38000 sezioni c'è una media di voti assoluti che è inferiore a 620,mentre dalla 38001 alla fine invece la media è più alta.
Proprio perché per prime arrivano quasi tutte le sezioni piccole(non solo quelle chiaramente),e solo dopo quelle grandi.
Allo stesso modo se moltiplichi 597 per 38529 ottieni 23001813 voti validi teorici,però qui invece sappiamo davvero che a quel punto sono stati solo 22076803,tu col tuo ragionamento invece ne calcoli 925010 in più.
Ti faccio un altro esempio:immagina un paese di solo 4 sezioni
nella prima sezione scrutinata il partito X prende 1000 voti,nella seconda 2000,nella terza 3000 e nella quarta ancora 3000.
Alla fine sono 9000 in tutto,2250 in media per ognuna delle 4 sezioni.
Però non puoi usare 2250 come moltiplicatore per determinare i voti di quel partito dopo 2 sezioni.
Facendolo otterresti 4500,però dopo le prime 2 sezioni nel mio esempio invece il partito X di voti ne ha ottenuto solo 3000(1000 nella prima e 2000 nella seconda)
Quindi i voti nulli non ballano affatto da 47 a 23,sono molto meno variabili,quello che cambia è il vero numero dei voti medi assoluti per sezione,è 620 solo in media,ma in realtà prima delle 38000 sezioni è più basso,dopo invece è più alto.
Per me voliamo sempre nel punto di partenza di questo post,e cioè che le elezioni in Italia sono un fenomeno completamente disomogeneo per poter essere affrontate con modelli matematico-statistici.
Per esempio i partiti e le coalizioni ottengono i loro valori medii quasi da nessuna parte.
Pensa al 2006 ad esempio.
Il risultato è stato che il CSX ha preso il 49,8% alla camera ed il CDX il 49,7%.
Però questo risultato di 50 a 50 per ciascuno non è stato raggiunto quasi da nessuna parte,quasi ovunque i partiti ottengono risultati o più alti o più bassi.
Su 20 regioni solo in Piemonte,Campania e Lazio nel 2006 si era 50 a 50 tra i 2 poli,nelle altre invece vi erano valori
completamente difformi.
Poi pure all'interno pure di queste 3 regioni vi erano grandi differenze.
In Piemonte il CSX era al 55% a Torino,col CDX al 55%,però nel resto del Piemonte era il CDX a prendere il 56%,a Cuneo,Novara ecc.
In Lazio il CSX vinceva col 52-53% a Roma,ma nelle altre province vinceva il CDX come a Latina con più del 60%.
Stesso discorso in Campania,CSX forte a Napoli,ma CDX a Caserta e Salerno.
Ed ovunque dati completamente disomogenei alla statistica generale.
Fino alle ultime europee in cui il PD ha preso il 40,8%,senza però prendere il 40,8% in nessuna provincia.
(ci si avvicina solo a Savona,Roma e Novara)
Per questo il tuo modello Roma non è applicabile alle elezioni italiane.
Poi guarda qua:
http://elezionistorico.interno.it/index ... es3=N&ms=S
Qui al Senato nel 2006 il CDX ha vinto con 18932 voti contro i 13656 del CSX.
Però alla Camera,dove ci sono a votare anche i giovani da 18 a 25 anni invece il CDX cala a 18011,senza contare poi che mentre al Senato il CDX doveva fare a meno dei 641 voti dell'Alleanza Siciliana invece alla camera avrebbe potuto recuperarli.
http://elezionistorico.interno.it/index ... es3=N&ms=S
Invece il CSX alla camera schizza a 20209.
Tutto al di fuori di logiche matematiche.
Avviene ciò perché per il CSX alla Camera era candidato Rosario Crocetta,il popolare sindaco di Gela,che per la sua popolarità viene votato anche da molti del CDX,oppure da cittadini che invece al Senato o si sono astenuti oppure hanno votato schede bianca.
Però siamo sempre fuori da logiche matematiche.
Guarda la vuoi sapere la verità ?
Ci vorrebbe che pubblicassero non solo le 61000 sezioni disaggregate,ma anche il loro ordine di arrivo,e la loro consistenza elettorale,così da poter fare un grafico per vedere l'evoluzione della forbice.
Per dire nel 2008 la prima sezione ad arrivare era una in cui il CSX aveva il 67,4%,il 60,4% del PD ed il 7% dell'IDV,
invece il CDX solo il 20,9% del PDL e nulla della Lega.
Quindi il grafico del 2008 parte dal 67,4% del CSX che cala fino al 37,5% e col CDX che dal 20,9% sale fino al 46,8%. ;)

marisa13
Guarda che il modello preso da Roma serve proprio per calcolare in modo approssimato gli afflussi tenendo conto della diversa ampiezza delle sezioni e per vedere se il flusso è avvenuto secondo fasce nette di sezioni o è stato casuale.
Tu hai guardato le pagine relative al 2008 ma mica tanto bene…
Dici che ho fatto calcoli che non ho mai fatto,in pratica neghi tutto il lavoro sul modello dicendo che ho fatto semplicemente un calcolo di proporzionalità fra le 61212 sezioni e le 38529 usando i voti del Ministero ma allora perché avrei costruito il modello?Poi metti delle cifre che non ho mai calcolato come 1,8 milioni,925010...
Io non ho mai moltiplicato 620 per 38529 per ottenere 23887980 come dici.
Boh...
Fra un po’ metto un’altra parte del ragionamento…

marisa13
I dati di cui mi servo sono tratti da questo link:
http://www.giornalettismo.com/archives/ ... tati-2014/
in particolare mi servo dei quadri che rappresentano l’andamento dello scrutinio a
7725 sezioni su 61592
14996 sezioni su 61592
17874 sezioni su 61592
29175 sezioni su 61592
36084 sezioni su 61592
46019 sezioni su 61592
61456 sezioni su 61592
Da questi quadri si può ricavare la media dei voti validi per sezione che risulta crescente fino all’ultimo in particolare:
7725 sezioni voti validi 2740270(voti PD 1193936 . 100/43,57)
media voti validi 2740270/7725=354
Con lo stesso procedimento:
14996 sezioni voti validi 5630310 media voti validi 375
17874 sezioni voti validi 6824857 media voti validi 381
29175 sezioni 11672790 media voti validi 400
36084 sezioni voti validi 14762006 media voti validi 409
46019 sezioni voti validi 19487343 media voti validi 423
61456 sezioni voti validi 27298001 media voti validi 444
L’ultimo schema di riepilogo non viene preso in considerazione perché contiene le sezioni estero
L’osservazione da cui parto è che la media dei voti validi cresce con l’aumentare delle sezioni fino all’ultimo questo potrebbe avvenire se le sezioni affluissero in ordine per numero di votanti ma non dovrebbe avvenire normalmente
Le % di ogni partito ,normalmente, dovrebbero variare in modo limitato(0,1-0,5 %) dopo il 50% dello scrutinio, mantenendosi dunque all’incirca costanti.
Le sezioni che ogni volta si aggiungono a termine scrutinio dovrebbero avere in media (quasi) lo stesso numero di voti per quel partito.
Aumenteranno dunque i voti dall’inizio alla fine di ogni partito ma non il numero medio dei voti per sezione per quel partito.

Il procedimento ripete quello usato per le elezioni 2008 a questi link:

http://www.webalice.it/marisa.pareto/votivalidi.htm
http://www.webalice.it/marisa.pareto/fasce.htm
http://www.webalice.it/marisa.pareto/ricapitolando.htm
http://www.webalice.it/marisa.pareto/verifiche.htm
http://www.webalice.it/marisa.pareto/verifiche.htm
Per il 2006 :
http://www.webalice.it/marisa.pareto/fi ... brogli.htm
http://www.webalice.it/marisa.pareto/alternativa1.htm
http://www.webalice.it/marisa.pareto/alternativa2.htm
Stabilire se le sezioni sono affluite in modo ordinato cioè a fasce nette di ampiezza crescente ci permette di sapere se l’aumento costante della media dei voti validi per sezione è un fatto normale o un’anomalia e in questo caso dovendo essere la media dei voti validi per sezione stabilizzata intorno al 50% se ci sia stata una trasformazione di voti non validi a validi di cui uno o più partiti abbiano usufruito.
Usando il modello precedentemente proposto si potrebbe ottenere il numero di votanti a 46019 sezioni scrutinate con un errore del 3%.
Calcoliamo il numero di votanti previsto a 46019 sezioni facendo riferimento al modello per l’Italia
492 - 18696
862 - 96544
431 - 81028
1970 - 516140
6775 - 2289950
12934 - 5328808
22555 - 11006840

Tot sez. votanti
46019 19338006
A 46019 sez.sarebbero affluite 492 sezioni della prima fascia,862 della seconda etc...con 18696 votanti,96544 votanti etc.. con un totale di 19338006 votanti
Aggiungiamo a questo rilievo il 3% di errore per sapere il numero massimo di votanti previsto quando sono affluite 46019 sezioni :
19338006+errore del 3%=19338006+895654=20233660=Affluenza massima tollerabile a 46019 sezioni

Vediamo invece quanti votanti sono stati segnalati :
19487343(voti validi segnalati dal Ministero a 46019 schede)
19487343 + schede non valide a 46019 sezioni scrutinate= votanti totali ufficiali
Le schede non valide approssimative su 19487343
saranno :
1532574 : 27448906 =x : 19487343
X=1088050
1532574=schede non valide totali segnalate dal ministero
19487343 voti validi segnalati dal ministero a 46019 sezioni scrutinate
27448906 voti validi totali segnalati dal ministero
19487343 + 1088050 = 205753393 voti validi segnalati dal ministero a 46019 sezioni scrutinate +schede non valide
205753393-20233660=341733 voti in più rispetto al massimo tollerato.
Quindi se le sezioni fossero affluite in ordine rispetto al numero votanti ci sarebbero almeno 341733 schede in più inserite.
Se invece le sezioni non sono affluite in ordine di grandezza si deve ipotizzare che voti non validi siano stati sostituiti con voti validi attribuiti a uno o più partiti.
Intorno al 50% la media dei voti validi per sezione dovrebbe stabilizzarsi quindi per ricavare i voti trasformati bisognerà considerare o il dato relativo a 36084 sezioni pervenute (58,6 %) o in ultima ipotesi a 46019 sezioni scrutinate (74%)
Nel primo caso i voti trasformati sarebbero :
444-409=35 voti a sezione
35 . 61592=2155720 schede non valide trasformate in voti in totale
Nel secondo caso i voti trasformati sarebbero :
444-423=21 schede non valide trasformate a sezione
21 . 61592 = 1293432 schede non valide trasformate in voti in totale

Antonio.114
Tu scrivi:

Questo è il link del documento con cui potete controllare i valori sotto elencati,
qui i valori fondamentali a 38529 sezioni scrutinate



voti validi 22076803 573/sez
votanti ap. 23889750 620,04955sez
sc.n.v.ap 1.812.947 47/sez

e a 61212 sezioni scrutinate



voti validi 36527230 597/sez
votanti assoluti 37954253 620,04955/sez
sc.n.v assolute 1427023 23/sez

Si passa da 573 voti validi a sezione a 597 voti validi a sezione con un aumento di 24 schede (dal 63,1% dello scrutinio alla fine).

La media delle schede non valide approssimative passa da 47 a 23,con una differenza di 24 schede dal 63,1 % dello scrutinio alla fine.

Il passaggio importante è questo:

Il valore schede non valide approssimative è stato calcolato moltiplicando la media dei votanti di sezione finale (620,04955)per il numero delle sezioni scrutinate (presumendo che oltre il 63,1 % questa si avvicinasse molto a quella reale) e sottraendo dai votanti approssimativi ,così ottenuti, i voti validi

per te i voti assoluti a 38529 sezioni sono 23889750,numero che si ottiene appunto moltiplicando
620,04955 per 38528,77.

Quindi ?

Antonio.114
Il punto della questione è che le elezioni sono un fenomeno disomogeneo,con tante variabili in campo che rendono impossibile l'applicazione di modelli matematico-statistici come il tuo.
Tu sembri non prendere in considerazione la connessione,non matematica ammetto,tra la variabile
tempo di scrutinio e la differente forza di un partito o di una coalizione nelle singole sezioni.
Se le elezioni fossero un evento statisticamente ordinato come dici tu allora tutte le sezioni dovrebbero dare i risultati
nello stesso tempo.
Per esempio 4 ore per le politiche,2 per il senato e 2 per la camera e quindi alle 17 dovremmo avere tutti i dati del
senato ed alle 19 tutti quelli della camera,visto che le politiche nel 2013 si sono chiuse alle 15 del pomeriggio.
Ma così in realtà non è,anche a parità di grandezza o quasi di sezione elettorale c'è sempre stata una diversa velocità tra sezione e sezione,anche grande.
Per esempio nel 2013 ho guardato alcuni comuni ed ho osservato che comuni relativamente grandi col CSX forte hanno chiuso molto presto lo scrutinio,
ad esempio:
Conselice a Ravenna col CSX al 51,1% alle 18 e 32 del 25 Febbraio.(camera)
Cotignola a Ravenna col CSX al 43,4% alle 19 e 30 del 25 Febbraio.(camera)
Anzola dell'Emilia a Bologna col CSX al 52,7% alle 19 e 16 del 25 Febbraio.(camera)
Zola Predosa a Bologna col CSX al 47,4% alle 19 e 23 del 25 Febbraio.(camera)
Impruneta a Firenze col CSX al 51,6 alle 19 e 16 del 25 Febbraio.(camera)
Borgo San Lorenzo a Firenze col CSX al 49,6% alle 19 e 49 del 25 Febbraio.(camera)

Comuni che hanno chiuso presto lo scrutinio della camera ed inserito prima i dati,
invece roccaforti del CDX hanno chiuso lo spoglio dopo:
Casal di Principe a Caserta col CDX al 53% alle 23 e 46 del 25 Febbraio.(camera)
Castel Volturno a Caserta col CDX al 52,8% alle 21 e 21 del 25 febbraio.(camera)
Fondi a Latina col CDX al 50,5% alle 23 e 49 del 25 Febbraio.(camera)
Tradate a Varese col CDX al 38,3% alle 23 e 27 del 25 Febbraio.(camera)
Vigevano a Pavia col CDX al 40,5% alle 21 e 32 del 25 Febbraio.(camera)
Jesolo a Venezia col CDX al 40,7% alle 20 e 10 del 25 Febbraio.(camera)

sono esempi,ma indicano la tendenza che c'è da 50 anni in Italia.
E' lo stesso motivo per cui anche oggi a 46000 sezioni il PD era al 42%,ma poi è calato fino al 40,8% finale,
contraddicendo apparentemente leggi statistiche,perchè le ultime 15000 sezioni erano del sud e delle isole in cui
il PD ha preso in media il 35% e non il 42% totalizzato fino a quel momento.
Però questa anomalia del troppo diverso tempo di scrutinio non vedo come si possa inserire in uno schema.
Ecco poi una tabella con alcuni intervalli di aggiornamento di scrutinio alle ultime europee:
tenendo presente che lo spoglio si è chiuso alle 23 del 25 maggio,
7725 sezioni all'1.00 del 26
14966 sezioni all'1.30 del 26
17874 sezioni all'1.46 del 26
29175 sezioni all'2.44 del 26
36084 sezioni all'3.20 del 26
46019 sezioni all'4.02 del 26
61459 sezioni all'6.06 del 26

Calcolando che lo spoglio inizia per tutte le sezioni alle 23 c'è una bella differenza tra intervalli.
Per scrutinare 29175 sezioni ovvero quasi la metà ci sono volute 3 ore e 44 minuti.
Per le altre invece ce ne sono volute7 e 06,quasi il doppio,ma hanno iniziato tutti assieme.

Antonio.114
Per quel che riguarda le tue considerazioni sulle elezioni del 2014:

L’osservazione da cui parto è che la media dei voti validi cresce con l’aumentare delle sezioni fino all’ultimo questo potrebbe avvenire se le sezioni affluissero in ordine per numero di votanti ma non dovrebbe avvenire normalmente.

Le elezioni più piccole arrivano comunque prima,quindi è assolutamente normale che ci sia in aumento dei voti validi.

Le % di ogni partito ,normalmente, dovrebbero variare in modo limitato(0,1-0,5 %) dopo il 50% dello scrutinio, mantenendosi dunque all’incirca costanti.

Assolutamente infondato,in Italia avviene da sempre che la sinistra cali,perchè prima arrivano un po' più di dati dalle regioni rosse e dopo più dati da dove la sinistra è invece più debole(commessione tra la variabile tempo di scrutinio
e forza di un partito o di una coalizione nella singola sezione)

Le sezioni che ogni volta si aggiungono a termine scrutinio dovrebbero avere in media (quasi) lo stesso numero di voti per quel partito.

Assolutamente infondato,ad esempio nel 2014 fino alle 46000 sezioni il PD era al 42%,ma nelle sezioni restanti aveva invece il 35% e queste aggiungendosi di volta in volta lo hanno fatto scendere al 40,8% a fine scrutinio.

Antonio.114
Inizio a domandarmi se credi davvero a quello che scrivi oppure ti diverti a trollare per dare dare da pensare alla gente.
;)
Ora dici che per calcolare i voti assoluti potenziali applichi la proporzione in base alla quale:
nulli ufficiali finali:voti validi finali=X(nulli a 46019 sezioni):voti validi a 46019 sezioni.
Quindi riferito al 2014:

nulli finali:
1542352(579353 bianche 959231 nulle 3768 contestate)

voti validi finali:
27448906

X

voti validi a 46019 sezioni:
senza IDV,Maie e SC ci sono a 46019 sezioni 19205849 voti validi a quel punto.
A spanne calcolo 120000 per IDV e SC e 40000 per le MAIE e ottengo quindi 19485849.

Quindi:
1542352:27448906=X:19485849

X=1094908

Quindi nelle prime 46019 sezioni ci sarebbero state in teoria 1094908 schede nulle.
Visto che alla fine delle 61952 sezioni sono invece state 1542352 sarebbero cresciute di 447444 nelle ultime
15573 sezioni.
Potrebbe starci.
Allora mi spieghi come nel 2008 arrivi a 1812947 nulle approssimate a 38259 sezioni ?
Perché 620,045955X38259=23889750
Laddove 620,045955 è la media dei votanti per i 61212 seggi in quanto
i 37954253 votanti finali diviso le 61212 sezioni fa appunto 620,045955
(vabbè tu sulla tua pagina internet riporti invece 620,04955,ma penso che per un errore hai saltato il 5 che è tra il 4 ed il 9 ;) )
23889750-22076803=1812947
Quindi avresti a 38259 sezioni 1812947 voti nulli,quando invece i nulli sono stati nel 2008 1427023,ma alla fine delle 61212
sezioni.
E la cosa non torna.
Invece applicando l'altro metodo per calcolare le nulle ad un certo punto dello spoglio per il 2008 avresti:
1427023:36527230=X:22076803
X=862482

Con questa proporzione,anche se per me ha un margine di errore,otterresti valori più credibili
per i parziali di 2008 e 2014,
nel 2014 con 46019 sezioni avresti infatti 1094908 nulle,ed alla fine arrivare alle 1542352 del ministero ci può stare.
Nel 2008 con 38529 sezioni avresti poi 862482 nulle,ed anche qui arrivare alle 1427023 finali ci può stare.
Nel primo caso si cresce di 447444 e nel secondo di 564541.
E la cosa ci può stare tenendo conto del diverso stato di avanzamento degli scrutini preso in esame,
nel 2014 siamo più circa 3 quarti,invece nel 2008 il dato era riferito a poco più del 60%.
Quindi ancora non capisco da dove esca il dato,completamente sballato,di 1.812.947 nulle approssimate
del 2008 relative a 38259 sezioni,che sarebbero più alte delle 1427023 effettive finali.
Tra l'altro così avresti una media di nulli di 25 voti a sezione finali nel 2014 e 23,7 parziali a 46019.
E nel 2008 di 23 finali e 22,3 a 38529.
Proprio non capisco quindi da dove salterebbe fuori per il 2008 la media di 47 voti non validi per sezione a 38529.

marisa13
Se qualcuno leggesse queste pagine informo che Antonio sta facendo dei salti fra le elezioni del 2014 e quelle del 2008 che,se vi interessasse,potete trovare a questi links :
http://www.webalice.it/marisa.pareto/bianchenulle.htm
http://www.webalice.it/marisa.pareto/votivalidi.htm
http://www.webalice.it/marisa.pareto/fasce.htm
http://www.webalice.it/marisa.pareto/ricapitolando.htm
http://www.webalice.it/marisa.pareto/verifiche.htm
…………………………………………………………………………………………
Tu dici in pratica che io ho calcolato le schede non valide in modo diverso nel 2008 e nel 2014.
Nel 2008 avrei calcolato le schede non valide in modo approssimato usando la media 620 moltiplicata per il numero delle sezioni per ottenere i votanti approssimativi e poi avrei sottratto da questi i voti validi ufficiali.
620 sarebbe la media dei votanti per sezione che dovrebbe assestarsi intorno al 50% essendo il primo rilievo al 63,1 usarla nella normalità dovrebbe essere accettabile.
Sempre nel 2008 però ho usato quel famoso modello ricavato da Roma per dimostrare che le sezioni non potevano essere arrivate in ordine di grandezza.
I punti di vista sono diversi.
Prima considero la situazione come dovrebbe essere normalmente cioè l’affluenza delle sezioni abbastanza casuale rispetto all’ordine di grandezza e calcolo i valori dei votanti secondo questo principio (moltiplicando la media votanti finale per il numero delle sezioni) ,in un secondo tempo considero l’ipotesi che l’afflusso sia avvenuto invece per fasce nette di ampiezza e che quindi i valori di schede non valide registrati siano corretti o meglio in modo indiretto che la media dei voti validi crescente sia corretta.
Questo modello funziona per assurdo cioè ammette che le sezioni arrivino in ordine di grandezza,prima le più piccole e poi via via quelle più grandi.
Nel 2008 supporre che le sezioni siano affluite in ordine di grandezza avrebbe comportato un’introduzione di voti in eccesso intorno ai due milioni quindi ho rifiutato questa ipotesi.
Nel 2008 ammettere che le sezioni non siano arrivate in ordine di grandezza comporterebbe che le schede non valide trasformate in voti validi dal 63,1 % siano 24 a sezione e quindi 24 . 61585 =1478040.
Lo stesso lavoro l’ho fatto per il 2006 e il 2014.
*I voti validi dei partiti a 46019 sezioni li ho calcolati usando i voti del PD e la loro % : 8178838 .100/41,97 in questo modo avanzi di calcolare i voti dei partiti che mancano.Le schede non valide del 2014 quindi diventano 1094908

Antonio.114
Pochi arrampicamenti sugli specchi,
spiega come hai calcolato per il 2008 1800000 voti nulli teorici a 38529 sezioni.
Nel tuo sito scrivi che lo hai fatto appunto moltiplicando la media finale di 620 validi per sezione per le 38529 sezioni dell'intervallo preso in considerazione.
Così scrivi di avere ottenuto i voti totali approssimati del 2008 a 38529 sezioni che appunto così risultano
23887980.
Poi da questi dici di avere sottratto i 22070000 voti validi rilevati però ufficialmente dal sito del ministero.
Ottenendo così poco più di 1,8 milioni di voti nulli,però solo teorici con 38529 sezioni scrutinate.
Infine diviendo 1,8 milioni per 38529 sezioni ottieni la media di 47 voti nulli per sezioni.
Siccome a fine scrutinio invece però i nulli sono stati 1,4 milioni,la media reale finale è di 23.
E secondo te i voti nulli sarebbero passati da 47 a 23.
Rispondi a questo.
Dire che 620 possa essere la media per poter calcolare i votanti a 38529 sezioni è sbagliato.
E' come dire che se il PD con 11172861 voti finali delle 61592 sezioni ha una media di 181 voti,
allora moltiplicando 181 per 36084 si ottiene il numero presunto di voti del Pd a quel punto.
Sarebbero 6531204,ma è un dato sballato,invece sono in realtà stati 6247281 a quel punto.
Oppure oggi con 28908004 votanti finali per 61592 sezioni hai una media di 469 votanti.
Se però utilizzi questo come moltiplicatore per sapere i votanti presunti a 36084 sezioni hai
36084x469=16923396
Ora sottraendo i validi effettivi ottieni:
16923396-14786975=2136421
Cioè un altro dato fuori dal mondo,a metà scrutinio avresti più schede nulle di quelle finali,che sono solo 1,5 milioni,
ma però relativi a 61500 sezioni.
Il tuo metodo è sbagliato in maniera pura e semplice,sempre perché tu ti ostini ad applicare le statistiche
laddove non ve ne sono le basi.
La verità è che 469 è la media finale dei votanti,ma non è assolutamente costante per tutto lo spoglio.
Prima è senza dubbio più bassa,fino a 36000 sezioni,poi cresce.
Questo perché naturalmente arrivano le sezioni meno numerose,e poi quelle più grandi.
quindi i tuoi ragionamenti sono senza senso.
Per come ragioni tu basterebbe allora fare votare gli elettori di un solo seggio,visto che per te un solo seggio dovrebbe avere le stesse percentuali nazionali per i partiti. ;)

marisa13
Il metodo che hai detto è quello che ho usato.
Secondo me le schede non valide sono passate da una media di 47 per sezione a 23 per sezione.Supporre che il PD abbia media di di 181 voti a sezione sarebbe sbagliato perchè quella è una media alterata,quella che dovrebbe essere valida è la media dei votanti per sezione finale sulla quale si spera non siano intervenuti.
Nelle elezioni 2014 usando il tuo dato ottenuto dalla media votanti finale a 36084 moltiplicato per il numero delle sezioni e togliendo i voti validi a 36084 sezioni si ottiene :
16923396-14786975=2161390 schede non valide a 36084 sezioni calcolate tenendo fissa la media votanti per sezione dal 50% in poi.
Il problema è che a più di metà conteggio la media dei votanti per sezione non sia ancora stabilizzata.
Se tu guardi la media dei votanti per sezione a 36084 dovrebbe essere :
28991258:61592=470,698
470,698 . 36084=16984682 votanti a 36084 sezioni con media assestata al 50%.
16984682-14762006=2222676 schede non valide calcolate con media assestata.
Tu a questo punto diresti che la media dei votanti per sezione è fasulla perchè affluiscono prima le sezioni piccole e poi quelle grandi e io ti direi che intorno al 50% quella dovrebbe stabilizzata ma se non fossi convinto ti proporrei l'uso del modello che dice che se le sezioni fossero pervenute in ordine di grandezza anche considerando l'errore massimo del modello tutto concentrato su quelle sezioni ti direbbe che sono stati inseriti 200843 voti in più :
492- 18696
862-96544
431-81028
1970-516140
6775-2289950
12934-5328808
12620-6158560
totale sez- votanti
36084 - 14489726

sommando ai votanti l'errore max del 3%
14489726+895654=15385380

Ai voti validi a 36084 sez che sono 14762006 aggiungendo le schede non valide:
1532574 :27448906=x:14762006
x= 824217
si ottiene:
14762006+824217=15586223

15586223-15385380=200843 voti in eccesso a 36084 sezioni scrutinate concentrando tutto l'errore del modello a 36084 sezioni scrutinate
Domani comincio a guardare il 2013...

Antonio.114
Ok,allora è chiarissimo,tu fai un modello che ritieni infallibile(non sapevo che tu fossi la verità rivelata)
siccome però tutti gli altri sono dei bari(ministero,siti dei comuni,siti delle prefetture,tutti i rappresentanti di lista
di tutti i partiti,tutte le strutture di tutti i partiti,tutti i Giudici che ricontano i verbali per proclamare i risultati delle elezioni)allora hai così la certezza che tutte le elezioni siano state barate.
Per dire alle ultime elezioni europee allora quale sarebbe la tua teoria ?
1) Berlusconi controlla ancora il Ministero degli Interni avendo costruito lì un sistema che dura dal 2006 e per questo fa salire Forza Italia dal 14% delle prime 3500 sezioni e fa scendere parimenti il PD dal 44,3% al 40,8% ?
2) Renzi è lui che fa scendere il PD dal 44,3% al 40,8% per non dare troppo nell'occhio.

Guarda,io non pretendo di sputare sentenze,solo che a differenza di te io seguo le elezioni da molto tempo e so come
vanno le cose,il tuo modello Roma è una sciocchezza pazzesca.
Scusa se ti posso essere sembrato scortese,ma questa è la pura verità.
Pretendere di incanalare il fenomeno delle elezioni politiche in uno schema del genere è sbagliato,punto e basta.
L'andamento degli scrutini è più complesso ed il tuo schema è totalmente errato,infatti applicato
da come risultati delle bestialità.
Tu ad esempio continui pervicacemente ad ignorare il fatto ad esempio del troppo diverso tempo di scrutinio
tra sezione e sezione,tipo il grande comune di sinistra dell'Emilia che in 2 ore finisce lo spoglio,mentre le zone
più a destra del sud ce ne mettono anch3 7 o 8 di ore.
Quindi per questo tutto quello che scrivi è una barzelletta,scientificamente parlando.
Per carità,posso apprezzare il lavoro che vi è stato dietro,ma ciò non toglie che sia comunque infondato.

Antonio.114
Poi scusa,tu scrivi che:

16923396-14786975=2161390

Quando invece:

16923396-14786975=2136421

Insomma,non è che mi stai trollando ? ;)

vict85
Sinceramente trovo che questa discussione si stia protraendo per troppo tempo. Fare statistica non vuol dire presentare dati attraverso grafici. Pensi che ci siano dei brogli elettorali o meglio che vi siano delle incongruenze statistiche? Bene, ma allora devi proporre un test statistico serio, compreso di percentuale di errore. Ma io non vedo niente di questo tipo finora, solo dati e grafici.

Detto questo penso che sezioni vicine tendano ad avere sia risultati che tempi di spoglio simili. Questo potrebbe spiegare tranquillamente l'andamento degli spogli.

Aggiungo infine che tra il risultato di un test statistico e la presentazione dei risultati passa spesso troppo poco tempo. Insomma la statistica presenta un andamento che troppo spesso viene visto come causale. Ma a volte la correlazione può essere sintomo di un terzo fattore che non è stato considerato. Insomma supponiamo che \(\displaystyle A \) implichi \(\displaystyle B \) e \(\displaystyle C \) ma che \(\displaystyle B \) e \(\displaystyle C \) siano sostanzialmente indipendenti (non sono troppo formale qui). Se in gran parte dei dati si ha \(\displaystyle A \) allora potrebbe sembrare che \(\displaystyle B \) implichi \(\displaystyle C \) e/o viceversa (la statistica non fornisce un verso :roll: che io sappia dai pochi esami che ho fatto a riguardo ).

Antonio.114
Sono perfettamente d'accordo con te.
E' questo alla fine è il senso del mio post.
E cioè che se la statistica è applicata in maniera troppo semplicistica si vedono brogli ovunque.
(infatti secondo Marisa sono state imbrogliate non solo le elezioni del 2006,ma anche quelle del 2008 e
2013 e 2014)
Per esempio l'andamento degli spogli che vedono i partiti di CSX calare e quelli del CDX crescere
specularmente da solo non è affatto impossibile e prova di un broglio.
In quanto per verificare basterebbe seguire in maniera un po' più approfondita gli spogli in base
all'ordine di arrivo e alla localizzazione geografica.
Per esempio alle ultime europee avviene un fenomeno statisticamente impossibile.
Il PD con 46000 sezioni scrutinate su 61000 è al 42%.
Per la statistica applicata quel dato dovrebbe essere cristallizzato.
Invece il PD nelle ultime 15000 sezioni cala al 40,8%.
Che secondo quella interpretazione della legga sarebbe un'enormità.
Però per capire che non vi erano brogli bastava appunto vedere le sezioni che mancavano.
Erano quasi tutte del Sud e delle Isole,in cui il PD pur essendo primo ha comunque preso col 34-35% una mdia molto più bassa rispetto a quella del resto del paese.

Rispondi
Per rispondere a questa discussione devi prima effettuare il login.