dilluns, 14 de desembre de 2009

Com expliquem la participació?

Analitzant una mica les dades sobre les consultes sobiranistes d'ahir qualsevol observador podria veure a primer cop d'ull que ens els municipis petits és on hi ha hagut més participació, mentre que en els grossos és on n'hi ha hagut menys.

Si dividim les poblacions en funció del seu nombre d'habitants obtenim les següents dades de participació:


Gràficament:Veiem clarament com a mesura que augmenta la mida del municipi, el percentatge de vots decreix molt considerablement.

En canvvi, el percentatge de respostes favorables al Sí no manté cap mena de relació amb la dimensió del municipi.

Però quant pot explicar la mida del municipi el percentatge de vots registrats?
Amb una simple regressió lineal podem obtenir aquests resultats. Cal en primer lloc que procedim a convertir la varible independent "participació" al seu logaritme, atès que aquesta no és una variable que mantingui estructures lineals: no és el mateix passar de 20 habitants a 21, que de 100.000 a 100.001 (sense entrar en més detalls, direm que aquest és un procediment comú en l'ús de la variable població). La variable dependent, el que volem explicar, és el percentatge de participació.

Els resultats els presentem gràficament (atès que l'equació obtinguda es fa difícil d'interpretar per la presència del logaritme, l'ometem, i donem només l'R2):

Al gràfic es pot veure clarament a mesura que la població augmenta, el percentatge de vot decreix molt considerablement.

I més concretament: una R2 de 0,438 vol dir que el 43,8% de les diferències de participació entre municipis s'expliquen per la dimensió de la població.

Per tots els qui esteu avesats a aquest tipus d'anàlisi ja sabreu que explicar pràcticament el 45% de la variança amb una sola variable és espectacular. Pels que no esteu acostumats a aquests tipus de termes, creieu-nos, és un percentatge elevadíssim!

38 comentaris:

Rocaberti ha dit...

Gràcies per les gràfiques! Si la relació fos linial, quina seria la participació a Barcelona? Sobre un 10-15%?

De tota manera, em manca l'explicació sociològica. Potser és que en les poblacions més grans és més difícil arribar a tothom? Que en les poblacions petites la gent està més ideologitzada?

Marc Guinjoan ha dit...

Rocaberti,

Suposant que el cens seria d'un milió i mig de persones, i assumint que és una relació linel, la participació seria del -14,9%... és a dir, encara deuríem vots!

Assumint que la funció no és lineal sinó logarítmica la cosa no millora gaire: en aquest cas la participació seria del -5%.

Què passa aquí però? evidentment que no disposem de dades per a una mostra tan gran, de manera que les línies de tendència les calcula amb una mida màxima de població de 75.000 persones (Sant Cugat). I no 1.500.000, que és 20 vegades més gros! aquí les prediccions van bé per municipis compresos entre la mida dels pobles que ahir van fer consultes.

salut!

Toni Rodon ha dit...

Marc,

A Osona les coses han anat diferent. Tenim pocs valors, però a Osona la relació tamany població - vot sortiria també positiva?

Sílvia Claveria ha dit...

Els d'Osona juguen en una divisió apart. El mecanisme causal és sencill: 1)Biaix en la selecció de municipis. 2) Als municipis petits els costos d'informació no són tan elevats. On hi ha hagut recursos tant econòmics com humans (Osona)la grandària no ha jugat un pes tan gran. Per no ser tan racional-choice, també caldria introduir alguna cosa de la moral/ càstig comunitàri...:)

Marc Guinjoan ha dit...

Toni,

A Osona el valor de l'R2 és de més de 56%!! He penjat el gràfic a http://dcpis.upf.edu/~marc-guinjoan/osona.jpg

I això em fa pensar una cosa: si estudiem només Osona, podem controlar per la feina que han fet les diferents comissions a cada poble. A Osona sabem del cert que tots els pobles han treballat igual i han fet la mateixa propaganda, de manera que evitem que una variable contaminada (que crea una relació espúria) com és la qualitat de la propaganda feta ens distorsioni l'estudi.

El fet que l'R2 sigui del 56% incrementa encara més la importància de la mida de la població per determinar la participació.

Marc Guinjoan ha dit...

Sílvia, no he vist el comentari fins més tard. De totes maneres, ja veus que a Osona la mida del municipi encara ha jugat un paper més important! O potser ha jugat el mateix paper, però el fet de controlar per la qualitat de la propaganda evita que hi hagi "soroll" en el model.

Toni Rodon ha dit...

No sé si s'hi referia, però la Sílvia quan ha dit "càstig" m'hi ha fet pensar. Potser en alguns llocs (a St Pere de Torelló, estava pensant...), moltes persones no han anat a votar per anar en contra de l'alcalde (en el cas que ho organitzés). Per allò de fer un vot "escapatori", és a dir, votar per raons molt diferents a les que es pregunten...

Sílvia Claveria ha dit...

Doncs aleshores, la teoria que els costos ( econòmics com morals) són més elevats segons augmenta la grandària encara és consistents. Per cert, si Carles Móra i l'Uriel a partir de la coordinadora creen un nou partit em semblarà lamentable.

Toni Rodon ha dit...

Totalment d'acord. No fotem el ridícul, sisplau!

Marc Guinjoan ha dit...

Correcte Sílvia, és consistent. I caldria per tant ser-ne molt conscients al moment de fer el salt a consultes a grans ciutats. És evident que si el sobiranisme "es vol fer gran" i vol ser alguna cosa important en el futur, ha d'ultrapassar les fronteres on ja sap que guanya. Dit això, cal anar molt en compte al preparar una consulta com la de Barcelona -sense el suport del consistori-, perquè si no es fa bé, la patacada pot ser de dimensions considerables.

ISB ha dit...

Potser que quedeu a fer una cervesa i resolgue les vostres diferències, nens del pati...
Els costos d'informació són decreixents, això pot ser una explicació clara, però caldria com diu el marc controlar per la qualitat o 'intensitat' de la informació. Teniu dades a nivell municipal sobre identificació nacional per veure si hi ha alguna relació que pugui haver-hi amb tamany de municipi?
La relació inversa entre tamany i participació no es produeix també a les eleccions ordinàries? És similar o una tendència difernet?

Roser Rifà ha dit...

Molt interessant!

Llàstima que acabo d'arribar a la conversa, m'hagués agradat entrar-hi una mica abans.

Marc Guinjoan ha dit...

Aubachs,

no t'ho creuràs però venint cap a casa he estat pensant en tres exercicis més que es deriven d'aquest anàlisi, dos dels quals compartim:

- aquí cal incorporar dades sobre "nacionalisme". Pensant-t'ho, em penso que el més fàcil i viable seria posar el percentatge de vots a partits nacionalistes en cada municipi. Controlar per aquest factor em semblaria interessant.

- Què passa en les altres consultes? hi ha costos d'informació decreixents? jo em penso que no, però s'hauria de comprovar. En tot cas, és impossible que siguin tan alts!

- De cara al proper post sobre les consultes cal introduir en la regressió una dicotòmica per Osona. A veure si realment el simple fet de ser d'allà augmenta la participació. Per fer-ho bé caldria també però controlar per nacionalisme...

caldrà seguir jugant per tant!

L'home del sac ha dit...

Bon anàlisi.
Jo crec que l'explicació seria que aquests referèndums han estat organitzats per persones voluntàries i amb pocs mitjans, llavors en pobles petits on tothom es coneix és molt fàcil fer arribar a tothom la informació necessària i fer-lo participar. Saben que aniran a votar i es trobaran a tal persona o tal altre que està entre els organitzadors o bé el dia abans es trobaran algú per la plaça i els animarà a anar-hi, etc... En una ciutat gran on la majoria de gent segurament no coneix als organitzadors ho veig més complicat i potser molts pensen que això només és cosa d'uns quants i prou, o fins i tot no s'acaben d'assabentar de com funciona la cosa (de fet, vaig parlar amb persones que vivien en poblacions on es feien consultes que ni tant sols ho sabien, i eren persones que diria que en cas de fer-se un referèndum vinculant molt possiblement votarien sí, si per exemple el seu partit de referència els ho digués clarament)

ISB ha dit...

Marc, a més, la idea d'introduir una dicotòmica pel cas d'osona podria recollir d'alguna manera la diferent organització de la consulta per part d'entitats diferents, i veure així alguna variació que pogués venir explicada per aquí (controlant per nacionalisme)

Estic esperant...;)

Unknown ha dit...

Crec que el darrer comentari va en la línia d'allò . Per altra banda, tot i que l'organització d'aquestes consultes es fa des de la societat civil és possible que s'hagi incorregut "voluntàriament" en una mena de biaix de selecció. Amb excepcions, lògicament, qui sap si no s'han triat municipis on:
a) L'associacionisme d'arrel sobiranista és forta.
b) les possibilitats de particular serien fortes.

Això canviaria una part important de la projecció en municipis grans. En tot cas seria la difusió de la informació l'element clau, i podria explicar-se per molts factors intrínsics a les xarxes. Això demostraria que en municipis grans cal més pedagogia/informació. Potser caldria anar a la teoria de xarxes, que és força complexa.

Marc Guinjoan ha dit...

Aubachs,

la inclusió de la variable dicotòmica Osona INCREMENTA EN 14,4 PUNTS PERCENTUALS LA PARTICIPACIÓ, controlant per la mida de municipi.
Quan es controla també pel percentatge de vot nacionalista, el percentatge disminueix lleugerament, fins a poc més del 10%. Simplement, espectacular, és un increment de més del 40% sonbre els votants; està clar que allà la feina es va fer molt bé.

Estem treballant en les dades per a veure si es pot fer alguna cosa de més entitat. Ja ho anirem penjant a mesura que surtin.

Andreu, em sembla bastant evident que hi ha un biaix de selecció molt considerable. Per això, i sempre amb reserves, controlar pel percentatge de vots nacionalistes ens hauria de servir per pal·liar una mica aquesta deficiència. Extrapolar a grans ciutats, tal com dius tu, em sembla molt complicat.

Toni Rodon ha dit...

Totalment d'acord amb el que s'ha dit. Nova contribució:

Jo crec que el mercat "potencial" no és tant el dels vots a partits "sobiranistes" (i.e. erc+ciu), sinó el percentatge de persones d'aquests partits que votarien a favor en un eventual referèndum. Amb enquestes podem estimar quin percentatge del total de votants de cada partit hauria dit "sí" i partir d'allà calcular les diferències.

pd/ Aubachs, el problema és que els dilluns ja no ens veiem i ubiquem la tertúlia que tenim al bar a la xarxa. Fem una "cervesa" virtual! :P

Marc Guinjoan ha dit...

Toni, el que passa és que amb enquestes no disposaríem d'una N suficientment gran per poder diferenciar entre municipis (que a més, són petits); per molts municipis simplement no tindríem ni una dada.
Emprar la suma de vots de CiU i ERC és una proxy, però és evident que el millor seria disposar de suficients dades d'enquesta per a cadascun dels pobles.

Toni Rodon ha dit...

No no. No m'has entès. No dic calcular amb enquestes. Dic de calcular el % de gent de cada partit (segons els vots que han rebut) que haurien votat sí. És a dir, el mercat potencial. Es resta el mercat potencial amb els que van anar a votar (el mercat real) i podem intentar explicar a què es deu aquesta diferència.

Ara millor?

Roger Sanjaume ha dit...

buf, és molt interessant l'estudi d'aquestes dades, espero que seguiu 'jugant'-hi!
Que la participació sigui més alta en pobles petits em sembla que té un motiu força evident, sense entrar en estudis rigorosos. Els pobles es diferencien de les ciutats per ser menys dinàmics i més cohesionats, al contrari de les ciutats que són dinàmiques i heterogènies.
Si tenim en compte que el pas de poble a ciutat és un continu de nombre d'habitants i que les consultes no s'han celebrat a tots els municipis sinó només als que ho han volgut queda clar: el fet que un col·lectiu de persones vulgui organitzar una consulta és més significatiu de la manera de pensar del municipi en general com més petit és i menys singificatiu com més gran és.
Suposo que això es podria demostrar fent aquest gràfic que comenteu que compari els vots a partits 'nacionalistes' amb la participació a les consultes.

Marc Guinjoan ha dit...

Toni, m'ha costat però ara sí que ho entenc. Podria ser interessant, en efecte; llàstima però que tinguem nivells de participació molt diferents, fet que no ens permet comprovar "de manera neta" el mercat potencial que comentes. Si hi hagués hagut la mateixa participació seria molt interessant perquè probablement reflectiria com d'independentista és CiU (i ERC, tot i que en menor mesura perquè se suposa indpenentista arreu) en el municipi.

Modest ha dit...

El factor proximitat ha d'influir en el grau de participació: proximitat física (als pobles hom es coneix i en parla directament amb els impulsors) o proximitat respecte a la consulta (quant a prop la sents teva, la consulta?), que s'aconsegueix amb propaganda, competència entre partits, debat en els mitjans, ...

Manuel ha dit...

I no pot ser que als pobles petits més gent s'hagi vist impulsada a anar a votar per allò del "què en diran", i en canvi a llocs més grans la gent, més emparada per l'anonimat, hagi actuat més en consciència? No vull dir gent que estés pel no, ans gent que el tema no els motivava.

Toni Rodon ha dit...

Manuel (et al.),

Sobre aquest aspecte la literatura ofereix dues teories:

Teoria de la modernització: ve a dir que a la ciutat es participarà més perquè els ciutadans tenen més recursos i més facilitats "polítiques".
Teoria comunitarista: Argumenta el contrari. Afirma que els llocs (ciutats, pobles..)petits és més fàcil que la gent voti perquè la percepció del vot com a "deure cívic" creix.
Jo crec que la primera teoria falla, però la segona també pot ser errònia. Podríem intentar veure (atenció: hipòtesi!) si a les poblacions amb més associacions (per tant, se suposa que amb més "cultura política), s'ha votat més.

Pd/ Roger i Modest: encantats de rebre comentaris vostres!

Marc Sanjaume ha dit...

Uau, quants comentaris! Quin post més exitós! A veure, jo també voldria mesurar una cosa: l'impacte de l'organització a cada poble. Això es podria fer peracionalitzant per nombre de voluntaris i pressupost. Però és difícil tenir les dades. En tot cas sí que crec que s'ahuria de fer aquesta regressió del suport a CiU i ERC...Suposo que explicaria força coses i podria rebatre les declaracions d'en Tena sobre la major eficàcia del "model Osona" sobre el "model Uriel"...

En fi, quina il·lusió tenir tants comentaris!

Marc Guinjoan ha dit...

Marc, la regressió incloent les variables CiU i Erc funciona, per ambdos partits. I a més a més, fins i tot controlant per això, la beta de la dicotòmica "Osona" encara és de 0,10. Això vol dir que el simple fet que la consulta es fes a Osona implica 10 punts percentuals d'increment de vot. Aquesta és sens dubte la variable més explicativa de totes.
Cal per tant felicitar la feina feta per Osona decideix, en el que ja podríem començar a anomenar "l'efecte Tena".

Modest, crec que en aquestes consultes hi ha hagut només aquest el factor proximitat "físic". En canvi, el factor de proximitat virtual (les mitjans de comunicació) i l'institucional (la propaganda i la validesa de les eleccions) ha mancat. En els pobles petits probablement el mecanisme de transmissió de la informació és probablement molt més informal que no en els pobles grans, fet que podria explicar aquesta gran diferència de participació.

Raül Presseguer ha dit...

Com a osonenc he llegit molt atentament les vostres reflexions. Jo us en donaré unes quantes que no són 'matemàtiques' però que crec que poden ajudar i en algun cas, confirmar algunes de les teories escrites aquí.
- Els pobles més petits d'Osona tenen un % de participació més elevat. Però també tenen el % de vot ERC i/o CiU més elevat de la comarca. Molts d'ells amb candidatura municipal única de CiU o d'ERC.
- Els pobles mitjans/grans amb alcaldia del PSC (són les alcaldies que han posat més traves a la celebració del referèndum) és on la participació ha punxat més i no s'ha arribat ni al 40% (ex: Centelles, Torelló, Roda de Ter)
- Excepció a part seria el cas de Manlleu, amb un % d'immigració molt alt i un problema amb la comunitat marroquina (que és majoritària)i el referèndum.
- Vic ha obtingut el 42,5%. Crec que Vic fa saltar totes les estadístiques i models, però la campanya a Vic ha estat molt i molt intensa. Crec que fins a límits que ningú que no l'hagi viscut es podria arribar a imaginar.
- Per tant, crec que les característiques locals pesen i molt a l'hora d'aconseguir una o altra participació. I en aquest cas, el fet que tota Osona anés amb la mateixa organització també hi ha influït molt.

Josep M. ha dit...

Felicitats pel post!
Un parell de preguntes, però:

1) Les diferències de participació en funció a la mida del municipi no es donen també en d'altres eleccions (sobretot municipals)?

2)Per la mesura del sentiment nacional, tindria sentit fer l'anàlisi per comarques (tenint en compte que aleshores sí que tindríeu mostres més grans a les enquestes) i veure si hi ha diferències significatives?

I un comentari: genial l'estimació de participació per Barcelona! (tot i la contextualització metodològica del Marc)

aukeran ha dit...

Estoy comenzando a procesar datos y en el primer muestreo existe una correlación muy alta, tipo R=0,95 entre votantes del "si" y la suma de votantes "CIU+ERC" en las elecciones al Parlament del 2006. La conclusión es que el referendum ha logrado movilizar todo el electorado de los partidos "nacionalistas". Extrapolando esta hipótesis a todo el Principado se obtendría un 45% de sies.

Marc Guinjoan ha dit...

A veure, intentaré respondre una mica a tots els comentaris, tot i que veig que alguns ja es van repetint, de manera que potser caldria fer un nou post-resum que inclogués algunes noves dades.

Raül: em sembla extremadament oportuns tots els comentaris que fas; la teva aproximacio és de caràcter qualitatiu i ens permet per tant arribar a un altre tipus de conclusions que les de caràcter quantitatiu, que són molt més "fredes" però ens permeten englobar el conjunt de pobles. Em sobta molt això que comentes de Manlleu: ens ho podries explicar millor?

Josep Ma.: està per veure si les diferències de participació també es donen en les consultes "oficials". M'aventuro a dir que no, tot i que en cas que fos que sí, de ben segur que no seria en aquesta mesura.
L'anàlisi per comarques tindria sentit, però jo crec que una bona aproximació sobre el perfil nacionalista ja és el vot ciu+erc+cup. Treballar amb enquesta però per comarques és un trade-off: tens més precisió sonbre el nacionalisme, però agrupes pobles que no tenen per què ser iguals. A més, disposaríem d'una N prou elevada per totes les comarques?

Aukeran: el fet que hi hagi una correlació molt elevada no vol dir que TOTS els votants de ciu+erc han anat a votar. Vol dir simplement que un percentatge similar de votants de ciu i erc en cadascun dels pobles ha votat. Assumeixes per tant que la resta de votants anirien a votar, i que dirien que sí, assumpció que personalment em sembla una mica agosarada.
Em costa molt personalment imaginar com fer una extrapolació sobre el total de la població de Catalunya. En tot cas, està clar que parteix dels supòsits que fas, potser però acurant una mica més les assumpcions.

Marc Belzunces ha dit...

He de dir que em sobta l'ús que fas de l'R quadrat.

Normalment, si més no a ciències naturals, l'R quadrat ens defineix la significació de la correlació entre dues variables. Típicament es considera que un R quadrat superior a 0.60 és significativa, per sota no. Tot i que en biologia es consideren sovint vàlides correlacions per sobre de 0.40.

A més, la distribució de les dades presenta un efecte de "punt gros". Tens les dades acumulades en un tram i després dues dades allunyades. Això pot fer incrementar artificialment l'R quadrat. En aquest sentit caldria depurar les dades. Considerar els punts per sobre de 90% com a outlayers i eliminar-los de l'anàlisi.

D'altra banda, la transformació de dades (en aquest cas aplicant log, però n'hi ha més) es fa per temes de normalitat (campana de Gaus), no pas de linealitat.

Transformades o no, les dades han passat un test de normalitat?

En tot cas, crec que seria interessant considerar el nombre d'habitants per lloc i mesa electoral. Per exemple, a Berga hi havia un únic lloc, i per a què votés tothom havien de passar més de 20 persones/minut per lloc electoral. A Osona, 1,4 persones/minut per lloc. A Berga va votar un 32% (té mèrit), però a Osona un 41%.

aukeran ha dit...

La correlación entre la variable "votos afirmativos" y "votos a ERC+CIU" en el 2006 es de R2=0,93. Modelizando el electorado obtengo un ajuste máximo considerando que el 80% de los votantes de ERC y CIU + 15% de los nouvinguts votaron afirmativamente. Es decir que los convocantes lograron movilizar al 80% de su electorado potencial. Si esto se repitiera en un referendum a escala de Principado no se llega al 50%, si se quiere superar el 50% se tiene que movilizar a muchos emigrantes y rascar votos entre el abstencionismo. Voy a aplicar el modelo a los municipios de febrero para hacer una predicción.

Marc Guinjoan ha dit...

Marc,

L'R2 és el quadrat de la correlació. Normalment es considera que una correlació és bastant forta (que no significativa, això depèn de la desviació estàndard) quan, tal com dius tu, està per sobre del 60%. Ara bé, correlació no vol dir causalitat; nosaltres tirem un model lineal, fet que assumeix linealitat (en aquest cas mida del municipi (variable independent) influeix sobre la participació (variable dependent)). I l'R2 ens indica el percentatge de variabilitat de la variable dependent que podem explicar amb la nostra variable independent. Imagino que això deu ser així tan en ciències naturals com socials.

En ciències socials no s'acostumen a eliminar els outliers, atès que de fer-ho, encara es podria argüir més fàcilment en contra de l'objectivitat de l'estudi. És cert però que tenim un efecte "punt gros" que, al meu parer és difícil de solucionar.
He mirat què passa si excloem les dues participacions tan elevades que comentes i l'R2 passa de 0,435 a 0,401. Repeteixo però, no veig motiu per excloure-les: hi ha altres municipis amb el mateix nombre d'habitants i amb participacions més baixes.

Correcte, la transformació es fa per una qüestió de normalitat, no de linealitat. Evidentment en aquesta regressió no s'ha testat l'homocedasticitat dels residus, tot i que a simple vista no "canta massa".

Si disposes de dades de meses electorals em faries un favor, evidentment que pot ser un factor explicatiu.

gràcies pels comentaris!

Marc Guinjoan ha dit...

Aukeran, els vots a ICV mira-t'ho però a nosaltres també ens resulten significatius, a un nivell de confiança del 5%.
Estem a l'espera de resultats! ;) Tot i això, repeteixo, aquestes extrapolacions són molt difícils de fer, donat que estem treballant només amb dades agregades, i per tant, assumim actituds individuals sense coneixer-los.

Toni Rodon ha dit...

Marc,

El poble demana un nou post!

Narcís ha dit...

No soc cap entes en la materia i pel que veig el nivell aquí és alt,:)

Nomès vull fer-vos avinent el cas de una població en concret que pot fer variar l'estadistica com es cas de Roses:

Per començar el cens electoral(uns 9000) al padrò municipal(16.000) és de casi el doble, no explicat només per els inmigrants, sinó per moltes segones residencies tant de gent nacional com europeus que estan empadronats a la Vila.

En segon lloc és una població molt dispersa amb una infinitat de urbanitzacions i amb grans distancies i carreteres sinuoses i tot i així només tenien un punt de votació.

La tercera dada ja és més subjectiva, tinc la impressió que la plataforma local no va fer gaire bé la seva feina,particularment crec que només de veure el diferencial del cens i el padró, ja tindrien que haver deixat aquesta consulta per una altre tongada.

No se si hi ha algun altre lloc que pugui distorsionar els estudis, però aquest cas crec, dins de la meva total ignorancia estadistica, que pot ser força evident, sí més no us el comento per que el podeu tenir en comte.

Toni Rodon ha dit...

Narcís,

La dispersió territorial s'ha tingut en compte i no sembla explicar la participació. Això no vol dir, però, que sigui el cas de Roses.

De fet, com bé comentes, la campanya sembla ser bona part de la clau de tot plegat. Però hi ha el problema de com mesurar-la. Una manera és veure el nombre de voluntaris per comarca. N'hi ha d'altres, però de ben segur que no seran exactes.

Pd/ A més, el que es fa aquí és un anàlisi quantitatiu. Caldria aprofundir més en anàlisis qualitatius, esclar.