venerdì 25 aprile 2014

sondaggi ed analisi dei dati Aprile 2014

Chiedere a qualcuno per chi ha intenzione di votare è la tecnica preferita dagli istituti di sondaggio politico-elettorale. La metodologia viene anche usata per sondaggi commerciali. Lo fanno per telefono, pongono domande più o meno aperte o suggestive e poi elaborano le risposte. Commettono errori clamorosi abbastanza frequentemente. 
I numeri non indicano percentuali di voto essendo riferiti solo ad alcuni dei
partiti  e non al totale dei partiti in competizione. Indicano invece la parità 
sostanziale  dei due principali partiti, smentita dai sondaggi e confermata 
invece dalle urne.
Alternativa a questo metodologia è l'analisi dei comportamenti. 
Piuttosto che chiederti quali siano le tue intenzioni di acquisto su un prodotto o le tue intenzioni di voto su uno o più partiti e valutare dopo le tue risposte, osservo quello che fai e da questa osservazione e misurazione elaboro un modello di comportamento tendenziale. 
Questa tecnica funziona meglio quando i dati comportamentali da analizzare sono in numero molto elevato (non un campione di popolazione). 
Non è affatto semplice ma voglio farvi vedere che tipo di risultati prognostici si possono ottenere. Il grafico che vedete indica la ricerca su internet delle parole "pdl", "pd" e "movimento 5 stelle" effettuata tra Gennaio ed Aprile 2013. Come si può notare la tendenza (opportunamente filtrata per evitare distorsioni che non vi sto a spiegare adesso) è esattamente sovrapponibile al risultato elettorale dei tre partiti ed il margine d'errore (la forchetta) è molto più basso di quello dei sondaggisti. Bisogna fare molta attenzione alle parole usate per evitare che siano ambigue o in disuso.
Per esempio, dal febbraio del 2014 usare "movimento 5 stelle" sarebbe distorsivo. La ragione è che nella seconda settimana di febbraio 2014 (e non saprei spiegare per quale motivo) la parola "m5s" viene digitata molto più frequentemente di "movimento 5 stelle". Quindi il "label" del "target" è cambiato per la prima volta negli ultimi 10 anni. Stessa analisi per le elezioni regionali in Sicilia del 2012 e stessa sovrapponibilità ai risultati elettorali regionali siciliani.
Altro vantaggio dell'analisi comportamentale è che non trattandosi di sondaggi in senso proprio possono essere pubblicati in periodo elettorale senza le restrizioni previste dalle leggi. Quanto alle analisi attuali...Aspettate la terza puntata, dico soltanto che a 30 giorni dalle elezioni ci sono dati con dinamiche comportamentali inaspettate una delle quali l'ho già detta. Ci potrebbero essere sorprese più grosse di quelle che alcuni istituti di sondaggi già rivelano...

Archivio blog