PDF článku ke stažení… - Data a výzkum

Transkript

Ekologické usuzování: explorace metody latentní
struktury za využití volebních dat z ČR1
Pat Lyons2
Sociologický ústav AV ČR, v.v.i.
Abstract: This article explores how aggregate level data may
be used to make inferences about individual level behaviour.
A common strategy in the past was to assume that the relations evident in aggregated data are also present in individual
data. Analysis of datasets where there is both individual and
aggregated information demonstrates that this assumption is
most often incorrect. This means that the relationships observed between variables at an aggregated level are unlikely to
be observed in individual level data. This is a problem because quite often social scientists only have aggregated data for
exploring individual level behaviour. A key question explored
in this article is how is it possible to validly and reliably use
aggregated datasets to make inferences about relationships
between variables at the individual level. An example analysis
is given using electoral data from the Czech Republic.
Data a výzkum - SDA Info 2008, Vol. 2, No. 1: 49 - 75.
(c) Sociologický ústav AV ČR, v.v.i., Praha 2008.
Jedna z prvních empirických analýz založených na využití regresní analýzy, které byly v historii politologie publikovány, se pokoušela odpovědět na otázku, jak
hlasují ženy. V době vydání práce, tedy v roce 1919, byla otázka rozdílů mezi pohlavími ve volebním chování do značné míry neprozkoumaná, a to ze dvou důvodů. Za
prvé bylo před koncem 1. světové války velmi málo zemí, v nichž měly všeobecné
hlasovací právo vedle mužů i ženy. Za druhé, systematická analýza volebních dat
byla v plenkách. Ve svém pokusu o odpověď na otázku, jak ženy volí, Ogburn a
1 Text vznikl jako součást řešení projektu Legitimita politického systému a nerovností, projekt GA ČR 403/06/1421, 2006–2008. Chtěl bych poděkovat oběma recenzentům a kolegovi Lukáši Linkovi za kritické připomínky a návrhy na vylepšení textu. Za veškeré faktické
nebo interpretační chyby zodpovídá autor. Data z šetření CVVM, na kterých je založena tato
analýza, byla poskytnuta Sociologickým datovým archivem Sociologického ústavu AV ČR.
2 Veškerou korespondenci posílejte na adresu: Pat Lyons, Sociologický ústav AV ČR, v.v.i.,
Jilská 1, 110 00 Praha 1, e-mail: [email protected].
- 49 -
Goltra [1919: 413] konstatovali, že jde o obtížný úkol, protože hlasy žen a mužů
se nesčítají odděleně. Při neexistenci tvrdých dat o hlasování žen navrhli Ogburn
a Goltra použít při analýze 26 referend k široké škále politických témat ve městě
Portland v Oregonu nepřímou metodu.
Nepřímá metoda v podstatě spočívala ve zkoumání souvislostí mezi výsledky
referend a podílem žen v jednotlivých volebních obvodech. Ogburn a Goltra předpokládali, že rozdíly v hlasování mezi jednotlivými okrsky budou odpovídat rozdílům
v poměru mezi ženami a muži, čímž vznikne metoda, jak nepřímo zjistit způsob
hlasování žen. Ve svých analýzách, jež používaly Pearsonovy korelační koeficienty,
zjistili, že ženy jsou oproti mužům méně nakloněny návrhům jako a) osmihodinový
pracovní den, b) progresivní zdanění, c) volební systém s poměrným zastoupením,
d) zrušení Senátu státu Oregon, e) odebrání volebního práva přistěhovalcům bez
amerického občanství nebo f) zákaz prodeje a konzumace alkoholu.
Tyto výsledky naznačovaly, že voličky v Portlandu byly v roce 1919 konzervativnější než voliči-muži [Ogburn, Goltra 1919: 417]. Výzkumníci ovšem konstatovali,
že taková interpretace jejich dat platí pouze za předpokladu, že veškeré rozdíly
mezi ženami a muži určuje stupeň konzervativnosti k jednotlivým analyzovaným
tématům, jež je způsoben právě jenom odlišností pohlaví. Při existenci jiných faktorů (například věkové složení, počet přistěhovalců, míra stranictví) ovlivňujících
individuální hlasování v daném okrsku by vysvětlení rozdílů mezi ženami a muži
pomocí konstantní úrovně konzervativnosti nebylo možné. Kromě toho by výsledky nebyly validní ani tehdy, pokud by individuální hlasování bylo ovlivněno
poměrem mezi ženami a muži v daném okrsku [Schuessler 1999: 10579]. Ogburn
a Goltra [1919: 415] si uvědomovali, že korelační koeficienty mohou být chybné,
protože korelace mezi volebním chováním a poměrem mezi ženami a muži zjištěné na úrovni okrsků mohly být teoreticky způsobeny libovolnou kombinací těchto
faktorů na individuální úrovni.
Jeden z nejvlivnějších výroků na obecné téma vztahů mezi strukturou individuálních a agregovaných dat říká, že je sice možné, aby korelace mezi daty (tj. mezi
pohlavím a konzervativností v hlasování) byla na obou úrovních analýzy stejná, ale
„podmínky, za kterých k tomu může dojít, jsou dosti vzdálené podmínkám, které se obvykle v datech vyskytují.“ [Robinson 1950: 357] Stručně řečeno, je vysoce
pravděpodobné, že korelace zjištěné v datových souborech pro agregovanou a individuální úroveň nebudou shodné.
V tomto článku budu postupovat následujícím způsobem. V první části představím problém ekologického usuzování a v následující části podám přehled jeho
nejznámějších řešení. Třetí část popíše přístup k ekologickému usuzování, který se
nazývá metoda latentní struktury. Ve čtvrté části budu ilustrovat možnosti použití této metody na českých volebních datech. Předposlední část pojedná možnosti
valorizace odhadů získaných ekologickým usuzováním pomocí dat z povolebních
dotazníkových šetření. Poté uvedu několik závěrečných poznámek.
Problém ekologického usuzování
Teoretické a empirické poznatky získané z jednotek analýzy na různých úrovních
jsou v sociálních vědách velmi rozšířené. Například sociologové zkoumají jednotlivce, rodiny, obce i společnosti; politologové sledují voliče, politické strany, třídy,
- 50 -
Obrázek 1. Vztah mezi pohlavím a zpĤsobem hlasování v referendu
Registrovaní voliþi
Muži
Ženy
Hlasování v referendu
Pro návrh
Proti návrhu
1-ǃim
ǃim
ǃiw
1-ǃiw
Ti
1-Ti
Xi
1-Xi
tematické skupiny, celé elektoráty nebo regionální uskupení uvnitř států; a ekonomové studují individuální spotřebu, chování firem nebo mezinárodní obchodní
toky. Dění na individuální úrovni zcela zřejmě ovlivňuje i vyšší úrovně agregace a
naopak. Jak jsme uvedli v úvodu, explanace a deskripce na různých úrovních by
byla velmi obtížná, protože vztah mezi úrovněmi analýzy je často znám jen velmi
povrchně, nebo je zcela neznámý.3
Tento problém je znám pod různými názvy: problém ekologického usuzování (ecological inference problem), problém agregačního zkreslení (aggregation
bias problem) nebo problém usuzování napříč úrovněmi (cross-level inference
problem). V geografii se s ekologickým usuzováním často setkáváme jako s problémem změnitelnosti územní jednotky analýzy (modifiable area unit problem), ve
kterém nejde jen o určení vztahů napříč jednotkami analýzy, ale i o to, že zjištěné
statistické vztahy mohou být ovlivněny i samotným způsobem konstrukce či agregace (územních) jednotek. Vzhledem k šíři problému ekologického usuzování je
vhodné pustit se na tomto místě do podrobnějšího vysvětlení.4
Obrázek 1 ukazuje typický příklad použití ekologického usuzování. Vrátíme-li
se k příkladu z úvodu, je cílem prozkoumat rozdíly mezi pohlavími v hlasování při
referendu. Za předpokladu, že za všechny volební okrsky je k dispozici pouze úřední statistika hlasování, máme pro každou jednotku k dispozici tři údaje. Za prvé,
oficiální výsledky – ty uvádějí, jaký podíl registrovaných voličů v okrsku i tvoří
muži [Xi]. Za druhé, analogicky máme údaj, jaký podíl voličů v každém okrsku
tvoří ženy [1-Xi]. Za třetí, oficiální výsledky ukazují, jaké procento voličů vyslovilo
v referendu souhlas [Ti]. Neznámý zůstává podíl mužů [βim] a žen [βiw], tedy těch,
kteří souhlas. Tyto údaje musíme odhadnout z podílu mužů v elektorátu [Xi], celkového podílu lidí, kteří hlasovali pro návrh [Ti], a celkové velikosti registrovaného
elektorátu Ni. Stručně řečeno, v obrázku 1 máme údaje pro krajní sloupec a řádek
matice, ale nikoli pro každé z jejích čtyř polí.
Celkový podíl voličů hlasujících pro návrh se z definice rovná součtu podílů
mužů a žen hlasujících pro návrh na celkovém počtu účastnících se voličů. To
umožňuje stanovit následující rovnici: Ti = βim Xi + βiw(1-Xi). Bohužel dva členy
3 Převod modelů z individuální úrovně na úroveň vyšší často nefunguje. Achen a Shively
[1995: 23-24] ukazují, že v případě jednoduché agregace standardního modelu nepřátelství
mezi jednotlivými státy, výsledek neodpovídá vlivnému modelu globálního konfliktu. Obecně lze pozorovat, že verze modelů povýšené z nižších úrovní na vyšší nebo snesené z úrovní
vyšších na nižší jsou často neslučitelné s dominantními modely, které byly pro danou konkrétní úroveň analýzy vyvinuty.
4 Výklad je na tomto místě nutně stručný a neformální. Pro více podrobností odkazuji na
Achena a Shivelyho [1995].
- 51 -
této rovnice jsou neznámé, a proto je neřešitelná. Toto je v literatuře známo jako
problém neurčitelnosti (indeterminancy). Jedním z řešení této rovnice je její převedení na regresní model [Ti = βm Xi + βw(1-Xi)] a odhadnutí podílů mužů a žen
hlasujících pro (tj. βim a βiw) z dat sebraných za jednotlivé okrsky v celé zemi.
Metody ekologického usuzování
Uvedený regresní model předpokládá, že podíl voličů, kteří v referendu vyslovili
souhlas, je ve všech okrscích stejný. To je velmi silný (a nerealistický) předpoklad.
Z regresního modelu tak vyplývají parametrické odhady „průměrného“ podílu souhlasících za muže i ženy ve všech volebních okrscích dohromady. S možností, že
podíl souhlasících je v některých okrscích vyšší a v jiných nižší, se nepočítá.
Goodmanova ekologická regrese
Tento přístup je znám jako Goodmanův model ekologické regrese [Goodman
1953]. Kvůli předpokladu, že vliv pohlaví je ve všech okrscích stejný, mohou z modelu vyplynout špatné odhady, například že souhlas vyslovilo více než sto procent
mužů nebo že proti hlasovalo méně než nula procent žen. Tento předpoklad je
možné uvolnit tak, aby se rozdíly v hlasování mezi pohlavími mohly lišit okrsek od
okrsku a aby se odchylky od celkového průměru staly v regresním modelu součástí
chyby odhadu. Toto řešení je však problematické, protože odchylky jednotlivých
okrsků od průměrného podílu souhlasících často korelují s nezávislými proměnnými. V důsledku toho dochází v tomto regresním modelu ke zkreslení způsobenému
špatnou specifikací modelu.
Metoda hranic
Alternativou ke Goodmanově ekologické regresi je metoda hranic (method of
bounds) navržená Duncanem a Davisem [1953]. Metoda hranic vychází ze skutečnosti, že za určitých okolností je možné určit chování na individuální úrovni
z agregovaných dat naprosto přesně. Je to možné tehdy, abychom se vrátili k našemu příkladu, když je elektorát v daném okrsku tvořen výhradně muži nebo
výhradně ženami. Zde známe individuální hlasování mužů nebo žen s jistotou.
Takovéto krajní situace mohou být sice považovány za triviální a nezajímavé, ale
dobře ilustrují užitečnost uplatnění znalosti struktury elektorátu v daném okrsku
jako základu pro odhad individuálního volebního chování. Toto chování se totiž
bude s jistotou pohybovat uvnitř určitých pevně stanovených limitů či hranic.
Metoda hranic zdůrazňuje skutečnost, že podíl určité skupiny – v uváděném
případě žen – hlasujících v referendu pro daný návrh má určitou minimální a maximální možnou výši. Minimální limit je určen jako celkový počet voličů v okrsku
(kteří k referendu skutečně přišli) snížený o celkový počet mužů v okrsku.5 Maximální limit odpovídá celkovému počtu žen žijících v okrsku nebo podmnožině
žen, které se referenda zúčastnily.6 Počet údajů potřebných ke stanovení hranic
5 Teoreticky je možné, aby celkový počet mužů-voličů převyšoval celkovou volební účast.
V této situaci bude minimální počet žen-voliček roven nule.
6 Například činí-li míra volební účasti 60 % a podíl žen v tomto elektorátu 80 %, pak je
maximální podíl žen-voliček, které se zúčastnily voleb, roven 0,6 / 0,8 = 0,75 a minimální
podíl je 0,2 / 0,8 = 0,25. Podobně lze odhadnout i hranice pro muže-voliče: minimum činí
- 52 -
pro ekologické usuzování o podmíněnosti volebního chování pohlavím se může
lišit, protože závisí na poměru mezi ženami a muži v jednotlivých okrscích. Minimální a maximální hranice obvykle uzavírají interval menší než polovina celého
rozsahu [0, 1] neboli v rozmezí 0 až 100 procent. Výsledky použití metody hranic
jsou teoreticky neproblematické, nicméně často mají příliš široký rozsah, a tak při
vysvětlování volebního chování nemívají skutečně podstatný význam.
Kingova metoda EI
Kingova [1997] novější metoda EI (zkratka pojmenovávající software pro použití
jeho techniky ekologického usuzování – Ecological Inference) kombinuje Goodmanův model ekologické regrese s Duncanovou a Davisovou metodou hranic. Kingův
postup se skládá ze dvou kroků. V prvním kroku je metodou hranic určen rozsah,
ve kterém se pohybují pravdivé hodnoty (např. individuální hlasování mužů a žen).
Ve druhém kroku se rozsah stanovený metodou hranic statisticky zužuje s použitím metody maximální pravděpodobnosti, pomocí níž je všem možným hodnotám
individuálního hlasování mužů a žen připsána relativní pravděpodobnost jejich
pravdivosti.
Pravděpodobnostní odhady ve druhém kroku jsou stanoveny pomocí Goodmanova regresního modelu, který je omezen třemi předpoklady. První předpoklad
uvolňuje východisko Goodmanova modelu, že podmíněnost volebního rozhodování pohlavím je ve všech volebních okrscích konstantní. V EI je umožněno kolísání
vztahu mezi pohlavím a volebním rozhodováním, neboť vzorce volebního chování
mužů a žen jsou vzájemně provázané. Vztah mezi pohlavím a volebním rozhodováním v referendu (s možností hlasovat pouze pro nebo proti) je definován jako
dvourozměrné normální rozdělení, které je omezené tak, aby všechny hodnoty ležely mezi hodnotami 0 a 1 (neboli 0 až 100 procent). Jedno z možných rozdělení
parametrů ilustruje obrázek 2a.
Metoda EI předpokládá existenci jediného vrcholu (modu) v rozdělení, který
označuje nejpravděpodobnější míru podmíněnosti volebního rozhodování pohlavím zjištěnou v celém elektorátu. Druhým předpokladem v odhadu maximální
pravděpodobnosti EI je, že podmíněnost volebního rozhodování pohlavím v jednom okrsku je nezávislá na všech ostatních okrscích, neboli – techničtěji řečeno
– že v datech není žádná prostorová korelace. Třetí předpoklad říká, že rozdílné
hlasování mužů a žen v žádném z okrsků nekoreluje s celkovým podílem žen a
mužů.7
Jedním ze způsobů, jak lze vyjádřit hranice uvedených parametrů (v našem
případě volebního chování mužů a žen v referendu), je použití tomografického zobrazení parametrů volebního rozhodování βim a βiw (viz obrázek 2b). Každá
z čar vyjadřuje koeficient spojený se všemi platnými možnostmi hlasování žen a
mužů. Do tohoto znázornění jsou dále zaneseny hraniční linie maximální hodnoty
pravděpodobnosti 50 % a 95 %, uvnitř kterých leží nejpravděpodobnější hodnoty.
0,25 (0,2 / 0,8) a maximum 0,33 (0,2 / 0,6).
7 Tento předpoklad může být uvolněn v rozšíření základního modelu EI, kde lze pro souvislost mezi podmíněností volebního rozhodování pohlavím a složením obyvatelstva okrsku
předpokládat konkrétní hodnotu nebo stanovit odhad.
- 53 -
Obrázek 2a. DvourozmČrné normální rozdČlení pro hlavní parametry modelu
Zdroj: King (1997: 105); Schuessler (1999: 10579).
Poznámka: Tento obrázek je prezentován pouze pro ilustrativní úþely. Ukazuje
hypotetický vztah mezi hlasováním v referendu a pohlavím (ǃim and ǃiw) s omezením
normálního rozdČlení do hranic 0 až 1.
Tyto dvě hraniční linie ve střední části obrázku 2b jsou vypočteny z dat použitých
k sestavení obrázku 2a. Ve společném středu obou elipsoidů leží místo nejvyšší
pravděpodobnosti (tj. vrchol obrázku 2a), které je určeno jako bod s nejvyšším
počtem průsečíků čar „metody hranic“. Horizontální rozměr každé čáry vyjadřuje volební rozhodování žen v konkrétním okrsku a vertikála ukazuje odpovídající
hodnoty pro muže. Hodnoty ležící uvnitř menšího elipsoidu (oblast 50 %) vyjadřují
ty hodnoty (βim, βiw), které mají nejvyšší pravděpodobnost, tj. jsou nejblíže vrcholu
obrázku 2a.
Obrázky 2a a 2b často analytikové používají k vyhodnocení výše uvedených
tří předpokladů metody EI. Přes intuitivnost tomografických zobrazení je jejich
opodstatněnost zpochybňována [Cho 1998]. Ústřední problém EI nastává, když
jsou odhadované hranice široké spíše než úzké. Při širokých hranicích může být
usuzování závislé na použitém modelu. Předpoklad, že společné rozdělení βim a
βiw má omezené dvourozměrné normální rozdělení, může být chybný, což může
vést k nevalidnímu usuzování [King, Rosen, Tanner 2004: 8]. Vzniká tak problém
zásadní neurčitelnosti, neboť jakékoliv statistické usuzování závisí na přijetí nějakých předpokladů o rozdělení, ale ke zvolení správné funkční podoby daných
parametrických rozdělení přitom nemáme dostatek dat. To v praxi znamená, že ke
- 54 -
Obrázek 2b. Tomografické zobrazení þar maximální vČrohodnosti
s odhady koeficientĤ získaných metodou hranic
Zdroj: Schuessler (1999: 10580).
Poznámka: Tento obrázek je prezentován pouze pro ilustrativní úþely. Ukazuje, jak by
hypoteticky vypadala informace o ǃim a ǃiw v pĜípadČ rĤzných kombinací vztahĤ
hlasování a pohlaví podle EI modelování. Horizontální osa ukazuje podíl žen, hlasující
pro návrh v referendu v každém z volebních obvodĤ, zatímco vertikální osa prezentuje
tutéž informaci pro muže. VČtší oblá þára reprezentuje 95 procentní maximální
pravdČpodobnost, zatímco menší þára reprezentuje 50 procentní maximální
pravdČpodobnost. Tyto oblé þáry jsou odhady vČtšiny skuteþných hodnot ǃim, ǃiw a jsou
dvoudimenzionální projekcí informací obsažených v obrázku 2a.
stejným odhadům mohou vést různé předpoklady o rozdělení βim a βiw a data nám
neumožňují s jistotou určit, které z nich je nejsprávnější.
Gary King a jeho kolegové rozšířili metodu EI tím, že se zaměřili na tuto specifickou otázku. Uvedli, že problém zásadní neurčitelnosti může být úspěšně řešen
pomocí hierarchického bayesovského modelování. Tato strategie v podstatě vkládá
ještě před použití EI další krok s cílem určit podobu společného rozdělení βim a
βiw, místo aby předpokládala, že jde o omezené dvourozměrné normální rozdělení.
Modelování je hierarchické v tom smyslu, že postupuje v řadě kroků:
1) modelování volební účasti,
2) odhad parametrů volebního rozhodování mužů a žen,
3) odhad všech neznámých parametrů s použitím techniky statistické simulace.
Bayesovské hierarchické modely ekologického usuzování
Předtím než uvedu příklad bayesovského hierarchického modelu ekologického
usuzování, musím vysvětlit, co míním bayesovským přístupem ke statistické analýze a usuzování. Gill [2008: 5] navrhuje vymezit základy bayesovského myšlení ve
třech obecných krocích:
- 55 -
1) určit pravděpodobnostní model, který zahrnuje nějaké předchozí poznatky o
parametrech, jejichž hodnoty neznáme,
2) rozšířit poznatky o neznámých parametrech tím, že je tato pravděpodobnost
podmíněna zjištěnými daty,
3) vyhodnotit schopnost modelu vysvětlit data a citlivost závěrů vůči předpokladům.
V tzv. frekvenčním pojetí statistiky, které v sociálních vědách převažuje, je
často (ne však vždy) cílem rozhodnout, zda je parametr statisticky významný na
základě prahové hodnoty, např. p ≤ 0,05. Naproti tomu ústřední charakteristikou
bayesovského modelu je „pravděpodobnostní popis rozdělení daného parametru“
[Gill 2008: 5-6].
Uvědomíme-li si tyto základní vlastnosti bayesovského pojetí statistického
modelování, je zřejmé, že Kingův model EI můžeme rozšířit, pokud vlastnosti společného rozdělení βim a βiw nebudeme a priori předpokládat, a naopak je v prvním
kroku určíme empiricky. Podrobnosti specifikace a odhadování hierarchického
bayesovského modelu pro model ekologického usuzování jsou příliš technické.
Pro stručnost zde podávám krátký neformální přehled. Zájemce o matematické
podrobnosti odkazuji na Rosena a kol. [2001] a Wakefielda [2004: 404-409].
Jak jsem naznačil výše, prvním krokem v bayesovském hierarchickém modelu
ekologického usuzování o podmíněnosti volebního chování pohlavím je modelování očekávaného počtu mužů a žen účastnících se referenda. King a kol. [2004]
modelovali volební účast s využitím binomického rozdělení.8 Tento model pravděpodobné volební účasti může být přímo vztažen k tomografickému znázornění
v obrázcích 2a a 2b a může být určitým sledem matematických operací prokázáno,
že řešení maximální pravděpodobnosti v tomto modelu je shodné s tomografickou
čarou. Předpokladem zde je, že podíl žen hlasujících v referendu pro nebo proti
(βiw) je výsledkem výběru z beta-rozdělení. Beta-rozdělení jsou užitečná, protože
mohou mít i více vrcholů, na rozdíl od podoby znázorněné v obrázku 2a. To odpovídá předpokladu, že v celém elektorátu neexistuje jen jediná nejpravděpodobnější
míra podmíněnosti volebního rozhodování pohlavím. Ve třetím kroku se předpokládá, že všechny neznámé parametry v prvních dvou krocích procesu modelování
mají exponenciální rozdělení.9
8 V bayesovské analýze jsou informace vnesené do procesu modelování před provedením
pozorování nazývány apriorními a proměnné jsou popisovány pravděpodobnostmi, pomocí
„apriorních rozdělení“, tj. předpokladů o pravděpodobném rozdělení proměnné v empirické realitě, založených na teorii nebo doplňkových informacích. Naproti tomu „aposteriorní
rozdělení“ je takové, které vyplývá z modelování. Kvalita modelu v bayesovské analýze závisí
především na míře, ve které aposteriorní rozdělení přináší nové informace o daném parametru oproti rozdělení apriornímu.
9 Rozdělení parametrů jako volební účast a volební rozhodnutí je v bayesovské statistice –
při neexistenci formálního matematického modelu – často určeno podle toho, které rozdělení má žádoucí vlastnosti. Například beta-rozdělení je obvykle definováno v intervalu [0, 1]
a jeho tvar umožňuje výhodné uvažování o způsobu rozložení volební účasti mezi volebními
okrsky. Přesný tvar beta-rozdělení může být odhadován pomocí MCMC. Naproti tomu z exponenciálního rozdělení při neexistenci formální teorie vyplývá, že řada proměnných ovlivňujících volební účast a rozhodnutí může být s výhodou vnímána jako série házení mincí
- 56 -
Při použití tohoto třífázového modelu se rozdělení všech neznámých parametrů
odhaduje uplatněním techniky MCMC (Markov Chain Monte Carlo) na oficiálních
volebních výsledcích ze všech okrsků.10 Důležité je, že tento model zkoumání jednoduchého volebního rozhodování (pro nebo proti) u pouhých dvou skupin může
být rozšířen i na volební systém s mnoha stranami a tři nebo více populačních
skupin (např. sociální třídy, profesní skupiny apod.). Není překvapivé, že odhadování bayesovského hierarchického modelu ekologického usuzování vyžaduje na
straně analytika určitou technickou a statistickou zdatnost.11 Mnoho výzkumníků,
kteří neovládají bayesovskou statistiku, se proto uchyluje k použití Kingovy [1997]
techniky EI, která je spojena se softwarem EzI, nebo jiné techniky s dostupnými a
snadno použitelnými softwarovými aplikacemi.
Použití Kingovy [1997] techniky EI v českém systému mnoha politických stran
přináší malou hodnotu, protože se tato technika omezuje na tabulky o dvakrát
dvou polích, kde je cílem explorace témat jako podmíněnost volební účasti nebo
volebního rozhodování v referendu pohlavím. Rozšíření EI vyžaduje schopnost
programování a z těchto důvodů věnujeme zbývající část článku ilustraci použití
jiné techniky ekologického usuzování, která byla navržena speciálně ke zkoumání
přesunů voličů mezi stranami v době mezi jedněmi a druhými volbami v systému
mnoha stran. Tato technika je navíc dostupná ve standardním softwarovém balíčku STATA a nevyžaduje znalost pokročilých technik souvisejících s bayesovským
modelováním.
Ekologické usuzování prostřednictvím techniky latentní struktury
Ke zkoumání vztahů mezi proměnnými na různých úrovních analýzy můžeme
alternativně přistupovat s předpokladem, že je proces vytváření dat podmíněn
latentními – nepozorovanými – faktory. Při ekologickém regresním modelování
agregovaných dat jsou používány pouze pozorované proměnné, neboť nejsou používány žádné předpoklady ohledně latentních faktorů, které ovlivňují hlasování,
jako například stranictví či sociální třída. Je však také možné považovat sledované
nezávislé proměnné za ukazatele nesledovaného, latentního faktoru, který zjištěné agregátní vzorce předurčuje. Například preference strany ve volbách může být
určena silou pouta, které občané k dané politické straně cítí. V této situaci je podíl
mezi všemi voliči. Například padne-li panna, referenda se zúčastním, jinak se nezúčastním.
Padne-li panna, budu v referendu hlasovat pro, jinak proti. MCMC je opět využito k odhadu
přesného tvaru exponenciálních rozdělení u každé z těchto proměnných v modelu. To jsou
intuitivně podané důvody pro použití beta-rozdělení a exponenciálního rozdělení při odhadování ekologických modelů s volebními daty.
10
MCMC je matematický algoritmus pro výběr vzorku z pravděpodobnostních
rozdělení. Obvykle se používá k přibližnému určení cílového rozdělení. Markovův řetězec
v algoritmu MCMC zajišťuje mírnou vzájemnou korelaci po sobě jdoucích hodnot ve vytvářeném rozdělení, což usnadňuje tvorbu žádoucích aposteriorních rozdělení ze souhrnných
statistických údajů [viz Gill 2008: 343ff.].
11
To v praxi znamená použití specializovaných statistických programů, které obsahují modul MCMC, např. WinBUGS nebo R. Složitost tohoto softwaru je sice v rozumných
mezích, ale analytická zběhlost v bayesovské statistice je nutná. Takovéto schopnosti dnes
mezi sociálními vědci nejsou příliš rozšířeny.
- 57 -
hlasů získaný touto stranou v každém okrsku vysvětlován sklonem voličů ke konzistentní podpoře stran v čase.12
Z toho vyplývá, že míry loajality a přesunů k jiným stranám pozorované
v agregovaných jednotkách (okrsky či volební obvody) závisejí na latentní míře
stranickosti – dlouhodobého emocionálního pouta občanů k určité straně. V řadě
zemí je síla stranického pouta nejsilnějším prediktorem volebního rozhodování na
individuální úrovni [Lyons, Linek 2007: 196; Lebeda a kol. 2007: 208]. Tato latentní stranickost je zřejmá na výši podpory, kterou strana obdržela v předchozích
volbách. Je rovněž možné přidat sociodemografické proměnné každého okrsku ze
sčítání lidu, které umožní zohlednit faktory, jako jsou ekonomické podmínky, třídní příslušnost, náboženské vyznání, etnická příslušnost apod., a modelovat volební
rozhodování v sérii voleb na různých úrovních (komunální, krajské, parlamentní a
evropské) s použitím závislé proměnné, např. volby strany nebo volební účasti.
Ekologická faktorová analýza s využitím konceptu stranictví
Považujeme-li agregovaná volební a sociodemografická data za ukazatele latentní
stranickosti, pak lze za užitečný postup pro vytváření modelu ekologického usuzování o voličských přesunech mezi po sobě následujícími volbami považovat analýzu
hlavních komponent (PCA). V těchto ekologických modelech PCA je stranickost
operacionalizována jako míra loajality ve volbách po sobě navazujících, zatímco
faktor sám představuje stranickost na úrovni územních jednotek. Mezi politology
má uvedený pohled na volební chování, který považuje kontinuitu volebního rozhodování v navazujících volbách za stranictví, mnoho zastánců.
Tento přístup dává větší smysl než Goodmanův model ekologické regrese, ve
kterém jsou míry voličských přesunů vnímány deskriptivně a minulá volba není
považována za faktor, který by mohl pomoci vysvětlit pozdější volební chování
[Achen, Shively 1995: 167-168]. Nevýhoda použití ekologické faktorové analýzy na
více voleb v řadě spočívá v předpokladu neměnnosti struktury volebního chování
v čase. Jinými slovy, ekologická faktorová analýza počítá se stabilním elektorátem.13
Volební změna je samozřejmě také důležitá, ale ke studiu mezivolební dynamiky
stranické podpory je vhodnější regresní model na spojených datových souborech.
Obecný model faktorové analýzy pro jednoduchý systém dvou stran se stoprocentní volební účastí lze vyjádřit rovnicí Dtj = qt + (pt – qt)Dj + Etj. V pomyslné
územní jednotce je podíl voličů projevujících přízeň straně 1 vyjádřen jako Dj, za12 Sklon vybírat v dlouhé řadě voleb stále stejnou stranu může být sociálně psychologicky interpretován jako pociťovaná vazba ke straně [Campbell a kol. 1960] nebo může být
důsledkem použití stran jako zdrojů politických informací [Schumpeter 1976], posouzení
výkonu stran a vlád v minulosti [Fiorina 1981] nebo racionálního hodnocení toho, co strany
podle předpokladů udělají v budoucnu [Lewis Beck 1988], může to být indikátor jiných
faktorů – třídy, etnické příslušnosti apod. Obecně lze říci, že většina voličů konzistentně
hlasuje pro jednu stranu bez ohledu na to, jaké důvody to ovlivňují.
13 Ekologická faktorová analýza by mohla být využita ke studiu kratší časové řady voleb.
V takovém případě by bylo možné interpretovat faktory vyvozené z každé analýzy pouze
v rámci daného modelu. Navíc by bylo obtížné porovnávat jednotlivé modely podle faktorové zátěže.
- 58 -
tímco podíl příznivců soupeře (strany 2) je logicky 1 - Dj. Podíl hlasů pro stranu
1 v konkrétních volbách je Dtj, kde pt vyjadřuje podíl věrných příznivců strany 1
a qt podíl příznivců strany 2, kteří odešli ke straně 1. Etj je statistická chyba, jejíž
předpokládaná střední hodnota se rovná nule a která nemá souvislost se závisle
proměnnou – rozhodnutím hlasovat pro stranu 1 (Dtj). Podíl podpory straně 1 mezi
mnoha voliči v dané územní jednotce (Dtj) lze považovat za pozorovanou proměnnou; následně pak Dj představuje tento faktor a qt a (pt – qt) jsou faktorové zátěže.
Tento model lze odhadovat pomocí standardní analýzy hlavních komponent,
pokud jsou k dispozici data za nejméně troje volby. Jeho interpretace na individuální úrovni je jednoduchá, měří-li faktorové zátěže loajalitu dané straně, respektive
odchody od ní, a faktor vyjadřuje míru stranickosti v daném okrsku. Lze tedy říci,
že hlasování pro stranu v aktuálních volbách se rovná síle vazby ke straně v dané
územní jednotce zvýšené o čistý přírůstek hlasů od minulých voleb [Achen, Shively
1995: 173-174].
Pomocí ekologické faktorové analýzy lze určovat míru změny stranické vazby,
ale nikoli o mnoho zajímavější míru přesunů voličů. Tu je ovšem možné z odhadované míry změny stranické vazby vypočítat.14 Je třeba poznamenat, že tento přístup
předpokládá dichotomickou povahu vazby, tj. volič se ke straně cítí blízko nebo
ne. To je předpoklad nerealistický. Naštěstí může být model latentní struktury pro
ekologické usuzování rozšířen tak, aby stranickost byla chápána jako ordinální proměnná s rozsahem od „velmi silná“ přes „silná“, „střední“ a „slabá“ až po „žádná“.
Nyní v krátkosti popíši důležité technické podrobnosti. Za předpokladu, že rozdělení pravděpodobnosti hlasování pro jednou stranu v jakékoli územní jednotce
je normální, pak odhady získané modelováním stranické podpory s pomocí ekologické faktorové analýzy (tj. podíly transformované na probitovou nebo logitovou
škálu) spolu vzájemně souvisejí. Měřené hodnoty voličské podpory jsou proto prostě částmi každého z těchto normálních rozdělení (určenými počtem stran v modelu
a počtem voličů, kteří nehlasovali). Ve statistice je souvislost mezi normálními
rozděleními dobře prozkoumána a je známa pod pojmem tetrachorická korelace.
Pomocí tetrachorické korelace je možné k odhadu míry voličských přesunů použít
koncept latentní vazby ke straně.
Uvedený výklad lze shrnout slovy, že podle latentního přístupu k ekologickému usuzování platí, že je-li stranická volba primárně určena dvěma nebo více
štěpeními, např. třídou a hranicí mezi městem a venkovem, pak lze vztah mezi
vzorci hlasování na agregované a individuální úrovni zjednodušit přijetím dvou
předpokladů, které činí odhad modelu řešitelným. Tyto předpoklady jsou: a) determinanty volebního rozhodování na individuální a agregované úrovni jsou stejné, tj.
je přítomen isomorfismus, b) rozptyl vysvětlený latentními faktory (třídou a odlišností mezi městem a venkovem) má na individuální i agregované úrovni obdobně
vysokou hodnotu.
14 K odhadu pravděpodobnosti hlasování pro konkrétní stranu x ve volbách 1 a 2 mohou
být použity modely stranictví. Vývoj volebních rozhodnutí mezi volbami se považuje za nezávislý (nepodmíněný stranickostí), a tak je pravděpodobnost konzistentního hlasování pro
jednu stranu v obou případech voleb vyjádřena jednoduše jako pravděpodobnost hlasování
dvakrát pro stranu x vydělená pravděpodobností hlasování pro stranu x ve volbách 1.
- 59 -
Zároveň se pro jednoduchost předpokládá, že celkové počty voličů jsou v po
sobě následujících volbách stejné. To je rozumný předpoklad v případě, že mezi
volbami nenastanou velké demografické změny. Model však umožňuje specifikovat změnu velikosti elektorátu skrze mechanismy registrace, úmrtí a migrace
v době mezi volbami technikou iterativního odhadování. Je třeba zdůraznit, že do
tohoto modelu jsou zahrnuti všichni registrovaní voliči. Ti voliči, kteří k volbám
nepřijdou, se považují za příznivce „strany nevoličů“. Matematické podrobnosti
techniky latentní struktury, které nejsou součástí tohoto neformálního úvodu, popisuje Thomsen [1999, 2007].
Předpoklad isomorfismu znamená, že ty samé latentní dimenze, které v konkrétní územní jednotce popisují rozdíly mezi jednotlivci, by měly popisovat i
rozdíly mezi homogenními politickými regiony v rámci země. To bude s větší jistotou platit pro malé oblasti, např. volební okrsky, a s menší jistotou pro oblasti větší,
například volební obvody nebo kraje. Tento předpoklad bude také blíže pravdě ve
funkčně homogenních regionech, definovaných specifickými strukturami štěpících
linií, např. rozložení levice a pravice. V takto politicky homogenních regionech mohou být předpokládány konstantní hodnoty parametrů modelu u všech jednotlivců.
Funkčně homogenní regiony s lokálními „politickými kulturami“ určíme pomocí
některé z technik redukce dat, například hierarchické shlukové analýzy.
Použití techniky latentní struktury na volebních datech z ČR
Abych předvedl fungování latentního přístupu v praxi, analyzoval jsem data z okresů o hlasování ve volbách do Poslanecké sněmovny v roce 2002 a do Evropského
parlamentu v roce 2004.15 Cílem této analýzy bylo odhadnout vzorce přesunů mezi
stranami. V roce 2004 byla volební účast o 30 procentních bodů nižší než v roce
2002 (pokles z 58 % na 28 %) a podpora hlavní vládnoucí strany ČSSD mezi registrovanými voliči poklesla ze 17,5 % na 2,5 %. Základní otázka zní: kteří voliči
hlasovali v roce 2002, ale v roce 2004 se rozhodli k volbám nepřijít? Stala se ČSSD
větší obětí tohoto rozdílu ve volební účasti než ostatní strany?
Prvním krokem v ekologickém usuzování technikou latentní struktury je určení
politicky homogenních regionů, na které se území republiky člení. Za účelem empirického určení počtu politických regionů jsem převedl procenta volební účasti
a podpory jednotlivých stran na logitové skóry a takto transformovaná data jsem
podrobil hierarchické shlukové analýze. Při ní jsem použil a) metodu „blokové
vzdálenosti“, a to z teoretických důvodů a z důvodu robustnějšího řešení, b) metodu „vnitroskupinové vazby“, abych zajistil co největší vnitřní homogenitu shluků.
K určení optimálního počtu shluků (politicky homogenních regionů) není k dispozici žádný formální statistický test, a tak se rozhodování o jejich „optimálnosti“
musí řídit jejich smysluplností. V této souvislosti výběr konkrétní kombinace shluků odůvodňuji souvislou povahou okresů v daných regionech nebo přítomností
význačných urbánních nebo venkovských vzorců volební podpory stran. Na volebních datech za ČR z let 2002 a 2004 jsem zkoumal řešení o jednom až čtyřech
shlucích. Jako nejvhodnější se ukázalo řešení o čtyřech shlucích. Grafické znázornění výsledků shlukové analýzy obsahuje obrázek 3.
15
Podrobnější popis tohoto výzkumu přinesli Linek a Lyons [2007a, b; 2008].
- 60 -
Obrázek 3.
Regiony s podobnou strukturou voliþského chování
získané na základČ hierarchické shlukové analýzy
výsledkĤ voleb do PS v roce 2002 a EP v roce 2004
Poznámka: Shluková analýza byla provedena na 159 územních jednotkách, jež byly
definovány jako okresy, z nichž byly vyþlenČny okresní mČsta; Praha byla rozdČlena do
patnácti mČstských þástí.
Obrázek ukazuje existenci čtyř lokálních politických kultur: 1) Čechy a urbanizované části Moravy, 2) venkovské části Moravy, 3) Praha, 4) severozápadní Čechy.
Tyto čtyři politické shluky představují regiony s odlišnou historií, např. Moravu
nebo Sudety (do značné míry obsažené ve shluku severozápadních Čech), nebo
se společnou sociální strukturou, např. Čechy spolu s urbánní Moravou. Podobná
analýza voličských přesunů mezi volbami v letech 2002 a 2006 dává naprosto stejný výsledek, což prokazuje, že tato regionální struktura je stabilní. Dřívější výzkum
voleb v letech 1920 až 1979 v Dánsku rovněž ukázal podobný druh regionálního
členění se značnou stabilitou v čase [Thomsen 1987].
Voličské přesuny mezi vládními a opozičními stranami
Předběžné zkoumání vzorců voličských přesunů na národní úrovni a v uvedených
čtyřech politických regionech odhalilo některé systematické rozdíly. Odhadované
výsledky voličských přesunů jsou uvedeny v tabulce 1. Podle nejvlivnějšího vysvětlení rozdílů volebního chování mezi parlamentními a evropskými volbami bychom
měli zaznamenat pokles podpory vládních stran (ČSSD, KDU-ČSL a US-DEU) a
zároveň zisky stran opozičních (ODS a KSČM).16
16 Zde mám na mysli teorii voleb druhého řádu, kterou původně navrhli Reif a Schmitt [1980].
Ti tvrdili, že voliči pohlížejí na jednotlivé typy voleb hiearchicky. Parlamentní volby považují
za nejdůležitější (prvního řádu) a ostatní volby, například krajské nebo evropské, jsou pro ně
méně důležité (druhého řádu). Podle této teorie se volby druhého řádu vyznačují relativně
- 61 -
Odhady uvedené v tabulce 1 ukazují významné regionální rozdíly ve voličských
přesunech mezi vládními a opozičními stranami. Například v Praze v roce 2004
přešlo k opozičním stranám 45 % příznivců vládních stran. Národní průměr byl
přitom jen 18 %. Silné regionální rozdíly panovaly i v míře volební účasti původních příznivců vládních stran – v severovýchodních Čechách nevolilo 80 % občanů,
zatímco v Praze byla míra volební neúčasti 45 %. Ojediněle vysokou míru stranické
loajality (37 %) vykazoval moravský venkov [Linek, Lyons 2007a: 348-349].
Voličské přesuny mezi velkými a malými stranami
Jednou z charakteristických vlastností evropských voleb je pokles podpory velkých
stran ve prospěch stran malých. Označení „velká“, „středně velká“ a „malá“ používám pro strany, jejichž podpora v roce 2002 činila min. 20 % (tj. ČSSD a ODS),
11–19 % (Koalice a KSČM), resp. max. 10 %. Nejvěrnější voliči náleželi středně
velkým stranám, křesťanským demokratům a komunistům, které v předchozích
výzkumech vykázaly nejvyšší míru stranické identifikace. Tento jev se ovšem liší
mezi regiony, protože příznivci středně velkých stran z roku 2002 mimo Prahu,
kteří šli v roce 2004 k volbám, většinou zůstávali věrní, případně přecházeli k malým stranám. Ve velkoměstské Praze tito „příznivci středně velkých stran“ (pokud
šli v roce 2004 k volbám) většinou nezůstávali své straně věrní (16 %), nýbrž přecházeli k menším stranám, a to v míře třikrát převyšující národní průměr (tj. 39 %
oproti 13 %). Obecněji výsledky ekologického usuzování říkají, že voličské přesuny
mezi malými a velkými stranami v letech 2002–2004 byly asymetrické. Příznivci
vládních stran z roku 2002, kteří v červnu 2004 přešli k malým stranám, tvořili
2,8 % celkového elektorátu. Opačným směrem však přešel mnohem nižší podíl voličů – pouhých 0,4 % (podrobnosti viz Linek, Lyons [2007a: 353-355]).
Uvedené dva vzorce voličských přesunů přímo souvisejí s teorií voleb druhého
řádu (viz poznámku 16). Tato teorie byla nejčastěji ověřována na agregovaných volebních datech a výsledky byly často vysvětlovány motivací individuálních voličů.
Klíčovou předností techniky ekologického usuzování je možnost testovat základní
prvky této teorie týkající se individuální úrovně na volebních datech z úrovně agregované. Jak jsem však uvedl výše, všechny techniky ekologického usuzování jsou
založeny na předpokladech o analyzovaných datech a odhady získané z modelů
ekologického usuzování je důležité validizovat jinými typy dat.
Validizace odhadů získaných ekologickým usuzováním
Validita techniky latentní struktury při odhadování voličských přesunů na individuální úrovni s pomocí okrskových dat je zcela zásadně podmíněna přijatými
předpoklady. Margolis [1988], Cleave a kol. [1995] a King [1997: 121-122] kritizují
Thomsenovu [1987] techniku latentní struktury při ekologickém usuzování z volebních dat v Dánsku, Finsku a Švédsku na základě čtyř kritérií.
Za prvé, základním předpokladem Thomsenova přístupu je shoda tetrachorických korelací na agregované a individuální úrovni. Porovnání švédských odhadů
získaných ekologickým usuzováním a na základě dotazníkového šetření naznačuje
konzervativnost tohoto přístupu, tj. fakt, že míru voličských přesunů podceňuje.
menší účastí a poklesem podpory velkých stran a stran vládních. Dva z těchto předpokladů
zde velmi stručně diskutujeme. Podrobnější zkoumání viz Linek a Lyons [2007a, b].
- 62 -
- 63 -
0,5
4,4
0,1
0,2
0,0
0,0
0,2
0,7
6,2
0,7
0,2
4,3
0,3
0,1
0,1
0,3
0,8
6,8
ODS
1,1
0,2
0,1
0,2
0,0
0,0
0,2
0,6
2,4
Venkovská Morava (N=21)
2002/2004
ýSSD
KSýM
ýSSD
KSýM
ODS
Koalice
SN
SZ
Ostatní
Nevoliþi
Celkem
0,3
0,1
7,1
0,3
0,0
0,1
0,1
0,8
8,8
1,0
0,1
0,3
0,2
0,0
0,1
0,1
0,9
2,6
0,9
3,3
0,2
0,0
0,0
0,0
0,1
1,2
5,8
ýSSD
KSýM
ODS
Koalice
SN
SZ
Ostatní
Nevoliþi
Celkem
ODS
0,5
0,3
0,1
4,0
0,0
0,1
0,1
0,7
5,7
KDU
0,3
0,1
0,1
1,4
0,0
0,0
0,1
0,4
2,4
KDU
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,1
0,3
ULD
0,1
0,0
0,1
0,1
0,0
0,0
0,0
0,2
0,4
ULD
0,8
0,0
0,3
0,2
0,1
0,0
0,1
0,5
2,1
SNK
0,6
0,0
0,9
0,4
0,0
0,1
0,1
0,9
2,9
SNK
0,1
0,1
0,1
0,1
0,0
0,0
0,1
0,2
0,7
SZ
0,1
0,0
0,2
0,1
0,0
0,1
0,0
0,4
0,9
SZ
0,6
0,3
0,3
0,1
0,0
0,0
0,1
0,8
2,1
NEZ
0,4
0,5
0,2
0,2
0,0
0,0
0,2
0,9
2,4
NEZ
0,2
0,8
0,1
0,4
0,0
0,0
0,1
0,5
2,2
Ostatní
0,2
0,2
0,3
0,2
0,1
0,0
0,6
0,5
2,1
Ostatní
Celkem
18,1
10,5
14,4
7,8
1,7
1,4
4,3
41,9
100,0
Celkem
14,1
18,6
6,3
12,6
5,8
11,2
5,7
11,1
1,9
2,2
1,0
1,3
3,4
4,6
33,5
38,4
71,6
100,0
(pokraþování...)
Nevoliþi
14,2
6,3
5,2
4,8
1,4
1,0
3,1
35,7
71,7
Nevoliþi
PĜesuny voliþĤ mezi volbami do PS v roce 2002 a EP v roce 2004 ve 4 regionech (celková
procenta) - 1. þást
ýechy a moravská mČsta (N=91)
2002/2004
ýSSD
KSýM
Tabulka 1.
- 64 -
1,1
0,3
0,2
0,2
0,0
0,0
0,0
0,4
2,1
0,9
3,4
0,1
0,1
0,0
0,0
0,1
1,0
5,9
0,1
0,1
5,9
0,1
0,0
0,1
0,2
0,9
6,1
ODS
Severozápadní ýechy (N=27)
2002/2004
ýSSD
KSýM
ýSSD
KSýM
ODS
Koalice
SN
SZ
Ostatní
Nevoliþi
Celkem
1,2
0,4
7,8
1,8
0,1
0,0
0,1
0,5
11,9
0,5
0,1
0,3
0,4
0,0
0,0
0,1
1,2
2,6
ODS
2,0
2,0
0,2
0,0
0,0
0,0
0,0
0,4
4,7
ýSSD
KSýM
ODS
Koalice
SN
SZ
Ostatní
Nevoliþi
Celkem
KSýM
0,4
0,1
0,0
0,1
0,0
0,0
0,0
0,2
0,9
KDU
0,2
0,0
0,4
0,7
0,0
0,0
0,0
0,4
1,7
KDU
0,1
0,0
0,0
0,1
0,0
0,0
0,0
0,1
0,4
ULD
0,1
0,0
0,2
0,4
0,0
0,0
0,0
0,3
1,0
ULD
0,2
0,0
0,6
0,2
0,0
0,0
0,0
0,8
1,9
SNK
0,1
0,0
1,0
4,6
0,0
0,0
0,0
0,4
6,1
SNK
0,0
0,0
0,3
0,0
0,0
0,0
0,0
0,2
0,6
SZ
0,1
0,0
0,2
0,8
0,0
0,0
0,0
0,3
1,4
SZ
0,1
0,2
0,4
0,0
0,1
0,1
0,3
1,0
2,2
NEZ
0,6
0,6
0,3
0,0
0,0
0,0
0,2
0,6
2,3
NEZ
0,1
0,2
0,2
0,0
0,1
0,0
0,7
0,5
1,7
Ostatní
0,3
0,1
0,5
0,1
0,1
0,1
0,3
0,5
2,0
Ostatní
Celkem
15,6
7,0
19,9
10,4
1,3
1,5
3,8
40,5
100,0
Celkem
13,1
16,1
7,9
12,7
4,9
11,3
3,2
4,1
0,9
1,1
1,0
1,4
2,7
1,1
44,4
49,3
78,2
100,0
(pokraþování...)
Nevoliþi
10,6
3,8
9,0
1,5
1,0
1,2
3,1
36,0
66,3
Nevoliþi
Praha (N=20)
2002/2004
ýSSD
Tabulka 1.
- 65 -
ULD
SNK
SZ
NEZ
Ostatní
Nevoliþi
Celkem
ýSSD
0,9
1,0
0,5
0,3
0,1
0,5
0,1
0,4
0,2
13,5
17,5
KSýM
0,2
3,4
0,1
0,1
0,0
0,0
0,0
0,5
0,3
6,1
10,7
ODS
0,2
0,2
6,3
0,1
0,1
0,8
0,2
0,3
0,3
5,8
14,2
Koalice
0,2
0,1
0,5
1,6
0,1
1,0
0,2
0,1
0,2
4,2
8,3
SN
0,0
0,0
0,1
0,0
0,0
0,0
0,0
0,0
0,1
1,3
1,6
SZ
0,0
0,0
0,1
0,0
0,0
0,1
0,0
0,0
0,0
1,1
1,4
Ostatní
0,1
0,1
0,2
0,1
0,0
0,1
0,0
0,2
0,4
3,1
4,3
Nevoliþi
0,8
1,0
0,8
0,4
0,2
0,7
0,3
0,8
0,5
36,6
42,1
Celkem
2,5
5,7
8,5
2,7
0,5
3,1
0,9
2,3
2,0
71,8
100,0
Poznámka: Jedná se o podíly voliþĤ na celkovém poþtu oprávnČných voliþĤ. Tím pádem celkové hodnoty podpory stran neudávají bČžnČ
známé hodnoty o podpoĜe tČchto stran ve volbách, neboĢ celkových sto procent tvoĜí I nevoliþi. N odkazuje k poþtu územních jednotek.
KDU
Všechny územní jednotky-ýR (N=159)
2002/2004
ýSSD
KSýM
ODS
Tabulka 1.
V důsledku toho nemusí být vždy platný předpoklad vysokého poměru rozptylů. Za
druhé, tato technika ekologického usuzování vyžaduje volbu „referenční“ kategorie. Tato volba má na získané odhady značný vliv. Za třetí, standardní postup, kdy
je vytvářena referenční kategorie nevoličů, se nezakládá na žádném teoreticky odůvodněném kritériu, nýbrž pouze na zkušenostech. Za čtvrté, validita a reliabilita
odhadů zásadním způsobem závisí na vymezení politicky homogenních územních
celků. Tento klíčový krok je však prováděn čistě induktivně a vůči ekologickému
usuzování technikou latentní struktury je vnější.
Na obranu své techniky ekologického usuzování pomocí latentní struktury
Thomsen [1987, 1999] na jednu stranu uznal, že při neplatnosti čtveřice předpokladů by výsledné odhady byly skutečně zatíženy systematickou chybou. Na stranu
druhou ale uvedl, že uvažovaná nepřítomnost systematické nebo náhodné chyby je
klíčovým důvodem, proč o odhady prostřednictvím ekologického usuzování voličských přesunů vůbec usilujeme. Postupy ekologického usuzování jsou teoreticky
pokročilejší než odhady voličských přesunů na základě dotazníkových šetření,
které, jak známo, trpí zkreslením odpovědí (chybnými odpověďmi) a výběrovou
chybou vzniklou v procesu šetření [Berglund, Thomsen 1990: 14-17; Thomsen,
Berglund, Wörlund 1991: 443-445].
Validizovat odhady získané za použití ekologického usuzování lze vzájemným
srovnáním odhadů voličských přesunů z ekologického usuzování a dotazníkových
šetření. Přístup k volebním údajům za individuální voliče je vzácný (v důsledku
ochrany osobních údajů), a tak většinou nemůžeme správnost technik ekologického
usuzování ověřit přímo. Zároveň jsou zřídka dostupná rozsáhlá panelová šetření,
která by byla pro účely analýzy prováděná po dvou po sobě jdoucích volbách.17
Nejlepším dostupným postupem je v této souvislosti použití datových souborů
z jednorázových šetření, které jsou pro křížové ověření odhadů ekologickým usuzováním snadno dostupné. V České republice máme za volební rok 2004 přístup
k (1.) exit-pollovému šetření a (2.) povolebnímu šetření. Exit-pollové šetření provedené agenturou SC&C pro Českou televizi zahrnovalo velký počet respondentů (n
= 9028), ale z definice se týkalo pouze těch, kteří přišli k volbám a svolili k rozhovoru. Může proto být zatíženo systematickým zkreslením, pokud jde o profil celého
elektorátu, jehož většina (62 %) v roce 2004 nehlasovala. Krátce po evropských
volbách (od 29. 6. do 7. 7.) byla dále uskutečněna česká vlna Evropské volební studie (European Election Study) se vzorkem 889 respondentů. Zde byla na vzorku
celého českého elektorátu použita dosti široká škála postojových otázek. Retrospektivní měření hlasování nám sice umožňuje sestavit matici voličských přesunů,
ale je nepřesné kvůli známému zkreslení odpovědí [Wright 1993; Tourangeau, Rips
a Rasinski 2000]. Výsledky tohoto šetření nadhodnocují volební účast o 22 %.
Postup validizace je založen na přímém srovnávání tří matic voličských přesunů, z nichž první byla vytvořena technikou ekologického usuzování, druhá pochází
17 Tyto výsledky navíc zkresluje panelový efekt: 1) vliv účasti v panelu na učení – respondenti věnují politice větší pozornost, 2) výběrové zkreslení – respondenti s menším zájmem
o politiku opouštějí panel častěji než lidé s větším zájmem. V důsledku toho jsou míry voličské loajality nadhodnocovány. Pokud tedy odhady z ekologického usuzování s panelovými
šetřeními úzce souvisejí, může to být paradoxně dokladem nesprávnosti ekologického modelu [Achen, Shively 1995: 176-177].
- 66 -
z Evropské volební studie a třetí z exit-pollového šetření SC&C s použitím Duncanova indexu odlišnosti (DDI).18 Předpokladem této valorizace je, že rozpětí hodnot
v uvedených třech maticích voličských přesunů vyjadřuje skutečné hodnoty voličských přesunů, které jsou neznámé. Na základě toho si můžeme být jisti, že vzorce
voličských přesunů přítomné ve všech třech maticích se blíží pravdivým hodnotám,
i když přesné odhady odvozené z jednotlivých datových souborů se nejspíše budou
od skutečné hodnoty lišit kvůli přítomnosti jiných zdrojů chyby nebo zkreslení.
Velikost matice a použití indexu odlišnosti
Pozorný čtenář si asi povšiml, že matice voličských přesunů získané z ekologického
usuzování a dotazníkových šetření SC&C a Evropská volební studie v tabulkách 2 a
4 mají rozdílnou velikost (tj. jiný počet řádek a sloupců). Důvodem je skutečnost,
že z šetření SC&C byli vyloučeni nevoliči a dvě malé strany, a proto je zde o 40 %
méně dat než u zbývajících dvou matic voličských přesunů. Porovnání všech tří
odhadů DDI je tedy problematické, neboť podíl v každé podskupině se změní kvůli
tomu, že počet sledovaných kategorií již není konstantní.
Z toho důvodu jsou pro valorizaci nejzajímavější odhady DDI u matic ekologického usuzování a Evropské volební studie. Je sice možné zmenšit tyto dvě matice
na rozměr matice z průzkumu SC&C, ale tím bychom obětovali hodnotné informace a mohli bychom v datech způsobit zkreslení. Proto uvádíme výsledky SC&C
velmi neformálním způsobem, především k ilustraci pravděpodobných účinků
porovnání vzorců voličských přesunů v celých elektorátech s podmnožinou všech
registrovaných voličů.
Sladění odhadů z šetření s výsledky voleb v letech 2002 a 2004
Při porovnávání hodnot voličských přesunů mezi různými případy voleb není
velikost matice jediným problémem. Aby bylo možné validně porovnávat odhady z ekologického usuzování s výsledky dotazníkových šetření, musíme výsledky
šetření sladit se skutečnými výsledky voleb v obou letech, stejně jako to činíme
v ekologické analýze. Pokud bychom odhady nesladili, ve skutečnosti bychom
porovnávali odhady různého druhu. Kvůli tomu by se porovnávané tři matice voličských přesunů neshodovaly. Jelikož není možné vytvořit jednotnou váhu pro
oba případy voleb zároveň, musí být použit iterativní postup vážení [Thomsen
1991: 448]. Při něm se používá technika log contingency. Ta převažuje procenta
voličských přesunů získaná z šetření tak, aby odpovídala skutečným volebním výsledkům. Pro účely iterativního vážení předpokládáme, že rozdělení volebních dat
je dvourozměrné normální [Kostelecký, Čermák 2003].
Výsledky validizace
Porovnání odhadů voličských přesunů získaných z ekologického usuzování a obou
šetření komplikuje skutečnost, že z průzkumu SC&C byli vyloučeni nevoliči (z
definice) a jedna malá strana, která působila ve vládě, ale nezískala žádné křeslo
18 Tento statistický nástroj [Runcán, Duncan 1955] popisuje celkovou míru, v níž je určitá série skupin nerovnoměrně rozložena mezi územní oblasti (okrsky) nebo zjištěné skupiny (jako
v naší studii). Popularita indexu odlišnosti vyplývá částečně z toho, že jeho hodnota není ovlivněna prostými změnami ve složení populace [viz Sakoda 1981; Taylor, Gorard a Fitz 2000].
- 67 -
- 68 -
2,1
0,2
0,1
0,0
0,0
0,0
0,0
0,1
2,5
ýSSD
KSýM
ODS
Koalice
SN
SZ
Ostatní
Nevoliþi
Celkem
ýSSD
KSýM
ODS
Koalice
SN
SZ
Ostatní
Nevoliþi
Celkem
2002/2004
0,9
0,2
0,2
0,2
0,0
0,0
0,1
0,8
2,5
ýSSD
Ekologické usuzování
ýSSD
2002/2004
1,0
3,4
0,2
0,1
0,0
0,0
0,1
1,0
5,7
KSýM
5,7
4,8
0,1
0,0
0,0
0,0
0,1
0,0
0,8
KSýM
0,5
0,1
6,3
0,5
0,1
0,1
0,2
0,8
8,5
ODS
8,5
0,0
6,5
0,2
0,0
0,0
0,5
0,5
0,8
ODS
0,3
0,1
0,1
1,6
0,0
0,0
0,1
0,4
2,7
KDU
2,7
0,0
0,1
2,1
0,0
0,2
0,1
0,1
0,2
KDU
0,1
0,0
0,1
0,1
0,0
0,0
0,0
0,2
0,5
ULD
0,5
0,0
0,5
0,0
0,0
0,0
0,0
0,0
0,0
ULD
0,5
0,0
0,8
1,0
0,0
0,1
0,1
0,7
3,1
SNK
3,1
0,0
0,6
1,0
0,0
0,0
0,3
0,5
0,7
SNK
0,1
0,0
0,2
0,2
0,0
0,0
0,0
0,3
0,9
SZ
0,9
0,0
0,1
0,1
0,0
0,4
0,0
0,3
0,1
SZ
0,4
0,5
0,3
0,1
0,0
0,0
0,2
0,8
2,3
NEZ
2,3
0,2
0,1
0,3
0,4
0,0
0,1
0,3
1,0
NEZ
0,2
0,3
0,3
0,2
0,1
0,0
0,4
0,5
2,0
Ostatní
2,0
0,0
0,2
0,0
0,0
0,0
0,9
0,3
0,7
Ostatní
13,5
6,1
5,8
4,2
1,3
1,1
3,1
36,6
71,8
Nevoliþi
71,8
5,6
6,0
4,6
1,2
0,9
2,3
40,1
11,1
Nevoliþi
17,5
10,7
14,2
8,3
1,6
1,4
4,3
42,1
100,0
Celkem
100,0
10,7
14,2
8,3
1,6
1,4
4,3
42,1
17,5
Celkem
Srovnání voliþských pĜesunĤ mezi volbami do PS v roce 2002 a EP v roce 2004 na základČ
Evropské volební studie a ekologického usuzování (celková procenta) - 1. þást
Evropská volební studie 2004
Tabulka 2.
- 69 -
Celkem
KSýM
ODS
Koalice
SN
SZ
Ostatní
Nevoliþi
ýSSD
2002/2004
0,0
0,0
-0,1
-0,2
0,0
0,0
-0,1
-0,7
1,2
ýSSD
0,0
1,4
-0,1
-0,1
0,0
0,0
0,0
-1,0
-0,2
KSýM
0,0
-0,1
0,2
-0,3
-0,1
-0,1
0,3
-0,3
0,3
ODS
KDU
0,0
-0,1
0,0
0,5
0,0
0,2
0,0
-0,3
-0,1
ULD
0,0
0,0
0,4
-0,1
0,0
0,0
0,0
-0,2
-0,1
0,0
0,0
-0,2
0,0
0,0
-0,1
0,2
-0,2
0,2
SNK
0,0
0,0
-0,1
-0,1
0,0
0,4
0,0
0,0
0,0
SZ
0,0
-0,3
-0,2
0,2
0,4
0,0
-0,1
-0,5
0,6
NEZ
0,0
-0,3
-0,1
-0,2
-0,1
0,0
0,5
-0,2
0,5
Ostatní
0,0
-0,5
0,2
0,4
-0,1
-0,2
-0,8
3,5
-2,4
Nevoliþi
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
Celkem
Srovnání voliþských pĜesunĤ mezi volbami do PS v roce 2002 a EP v roce 2004 na základČ
Evropské volební studie a ekologického usuzování (celková procenta) - 2. þást
Rozdíl: Evropská volební studie 2004 mínus ekologické usuzování
Tabulka 2.
Tabulka 3. Srovnání voliþských pĜesunĤ mezi volbami do PS v roce
2002 a EP v roce 2004 na základČ Evropské volební
studie a exit-pollového šetĜení (celková procenta)
Evropská volební studie 2004
2002/
2004
ýSSD KSýM ODS
KDU
SNK
SZ
NEZ
Ostatní Celkem
ýSSD
KSýM
ODS
Koalice
Ostatní
Nevoliþi
5,7
0,4
0,7
0,0
0,0
2,1
3,5
15,6
0,7
0,0
0,5
0,0
1,1
0,0
22,6
1,0
1,2
4,1
0,2
0,0
0,2
8,3
0,3
0,6
0,8
0,0
1,5
5,1
0,5
3,0
0,1
0,0
0,3
0,6
0,6
1,6
1,7
0,2
0,4
2,0
1,2
2,7
1,1
0,0
2,8
0,0
2,4
2,7
14,2
16,1
29,1
17,0
6,7
16,9
Celkem
8,8
20,3
30,0
9,6
11,0
3,2
8,2
8,9
100,0
Exit-pollové šetĜení
2002/
2004
ýSSD KSýM
Ostatní Celkem
ODS
KDU
SNK
SZ
NEZ
ýSSD
6,4
2,5
1,4
0,4
1,1
0,4
1,3
0,8
14,2
KSýM
ODS
0,1
0,6
14,9
0,3
0,1
21,8
0,1
0,4
0,1
2,3
0,0
0,3
0,4
2,3
0,5
1,2
16,1
29,1
Koalice
Ostatní
0,3
0,2
0,3
0,2
1,7
0,5
7,5
0,2
4,0
1,5
0,6
1,0
0,6
1,2
2,0
2,1
17,0
6,7
Nevoliþi
1,2
2,2
4,6
1,0
2,1
0,9
2,5
2,4
16,9
Celkem
8,8
20,3
30,0
9,6
11,0
3,2
8,2
8,9
100,0
Rozdíl: Evropská volební studie 2004 mínus exit-pollové šetĜení
2002/
2004
ýSSD KSýM ODS
KDU
SNK
SZ
NEZ Ostatní Celkem
ýSSD
-0,7
1,0
-0,2
-0,2
-0,3
-0,2
0,3
0,3
0,0
KSýM
ODS
0,3
0,0
0,7
0,5
-0,1
0,8
-0,1
0,2
-0,1
-0,8
0,0
0,1
-0,1
-1,9
-0,5
1,6
0,0
0,0
Koalice
Ostatní
-0,3
-0,2
-0,3
0,3
-0,7
0,7
0,7
0,1
1,1
-0,9
0,1
-0,4
1,3
0,1
-2,0
0,3
0,0
0,0
Nevoliþi
0,9
-2,2
-0,5
-0,4
1,0
0,7
0,3
0,3
0,0
Celkem
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
v Evropském parlamentu (US-DEU, resp. koalice ULD). Chceme-li tedy porovnat
všechny matice voličských přesunů, musíme se zaměřit pouze na voliče, kteří přišli
k volbám. Zároveň ale jsme schopni porovnávat odhady voličských přesunů za celý
elektorát na základě Evropské volební studie a výsledků ekologického usuzování.
Všechna tato srovnání jsou uvedena v tabulkách 2, 3 a 4.
Pro stručnost opět neuvádím podrobnosti o rozdílech zjištěných v těchto tabulkách a případné zájemce odkazuji k podrobnější diskusi u Linka a Lyonse [2007a:
345-347; 2007b: 255, pozn.). Obrázek 4 znázorňuje shrnutí DDI za všechny tři
- 70 -
Tabulka 4. Srovnání voliþských pĜesunĤ mezi volbami do PS v roce
2002 a EP v roce 2004 na základČ exit-pollového šetĜení
a ekologického usuzování (celková procenta)
Exit-pollové šetĜení
2002/
2004
ýSSD KSýM
Ostatní Celkem
ODS
KDU
SNK
SZ
NEZ
ýSSD
6,4
2,5
1,4
0,4
1,1
0,4
1,3
0,8
14,2
KSýM
ODS
0,1
0,6
14,9
0,3
0,1
21,8
0,1
0,4
0,1
2,3
0,0
0,3
0,4
2,3
0,5
1,2
16,1
29,1
Koalice
Ostatní
0,3
0,2
0,3
0,2
1,7
0,5
7,5
0,2
4,0
1,5
0,6
1,0
0,6
1,2
2,0
2,1
17,0
6,7
Nevoliþi
1,2
2,2
4,6
1,0
2,1
0,9
2,5
2,4
16,9
Celkem
8,8
20,3
30,0
9,6
11,0
3,2
8,2
8,9
100,0
Ekologické usuzování
2002/
2004
ýSSD KSýM
Ostatní Celkem
ODS
KDU
SNK
SZ
NEZ
ýSSD
3,3
3,7
1,8
1,0
1,6
0,3
1,4
1,0
14,2
KSýM
ODS
0,5
0,9
11,9
0,6
0,5
22,1
0,3
0,3
0,1
2,5
0,1
0,6
1,6
0,9
1,2
1,1
16,1
29,1
Koalice
Ostatní
1,1
0,5
0,3
0,7
2,3
1,0
6,4
0,4
4,1
0,5
1,0
0,3
0,5
1,1
1,5
2,2
17,0
6,7
Nevoliþi
2,5
3,1
2,4
1,2
2,1
0,9
2,7
2,0
16,9
Celkem
8,8
20,3
30,0
9,6
11,0
3,2
8,2
8,9
100,0
Rozdíl: ekologické usuzování mínus exit-pollové šetĜení
2002/
2004
ýSSD KSýM ODS
KDU
SNK
SZ
NEZ
Ostatní Celkem
ýSSD
3,0
-1,2
-0,4
-0,7
-0,5
0,0
-0,1
-0,2
0,0
KSýM
ODS
-0,4
-0,2
2,9
-0,3
-0,4
-0,3
-0,2
0,0
0,0
-0,2
0,0
-0,3
-1,3
1,3
-0,7
0,1
0,0
0,0
Koalice
Ostatní
-0,8
-0,3
0,0
-0,5
-0,5
-0,6
1,2
-0,2
-0,1
0,9
-0,4
0,7
0,2
0,1
0,5
-0,1
0,0
0,0
Nevoliþi
-1,3
-0,9
2,2
-0,1
0,1
0,0
-0,2
0,3
0,0
Celkem
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
matice voličských přesunů (vyčíslené ve spodních částech tabulek 2, 3 a 4). Tyto
míry odlišnosti naznačují, že odhady voličských přesunů z ekologického usuzování
a Evropské volební studie jsou si navzájem více podobné (11,3) než každý z těchto
dvou odhadů v porovnání s průzkumem SC&C (13,4). Případná otázka zní: je hodnota 11,3 „dobrá“, nebo „špatná“?
K zodpovězení této otázky bude nejvhodnější porovnat skóre odlišnosti, které bylo zjištěné u stejné analýzy voličských přesunů provedené v jiných zemích.
Celkově je hodnota DDI 11,3 pro ČR v letech 2002 a 2004 s předchozími výzku- 71 -
Obrázek 4.
Srovnání matic voliþských pĜesunĤ vytvoĜených na
základČ exit-pollového šetĜení SC&C, povolebního
šetĜení EES 2004 a ekologického usuzování
11.3
EES04
13.4
Ekologické
usuzování
SC&C
Exit-poll
13.4
Poznámka: Hodnoty odkazují k Duncanovu indexu odlišnosti. V nejjednodušším
pĜípadČ, když uvažujeme jen dvČ strany, je tento index definován jako D = 0.5 ƶ ŇAi/X
– Bi/YŇ, kde Ai a Bi jsou poþty voliþĤ, kteĜí zmČnili své rozhodnutí ve prospČch druhé ze
stran nebo neúþasti ve volbČ. Jestliže srovnáváme zmČny mezi více stranami, každá
zmČna mezi párem stran je srovnávána se všemi ostatními páry a je odhadován
prĤmČrný index. Odhad generalizovaného indexu nepodobnosti podrobnČ popisuje
Sakoda [1981].
my dosti srovnatelná. U Dánska vedla podobná analýza za období let 1968–1975
k průměrnému DDI 12,5. Ve Švédsku odpovídala odlišnost mezi odhady voličských
přesunů z ekologického usuzování a šetření v letech 1970 a 1985 hodnotě 12,3 a ve
Finsku v letech 1962 a 1983 činila 8,6 [Thomsen, Berglund, Wörlund 1991: 453,
457 a 462].
Vyšší hodnota DDI mezi oběma šetřeními (13,4) nepochybně odráží výše popsané rozdíly ve velikosti matic. V této souvislosti dosavadní výzkum často ukazuje,
že odlišnost mezi odhady voličských přesunů z různých šetření bývá nižší než mezi
odhady z šetření a ekologického usuzování.
Odhady odlišnosti týkající se průzkumu SC&C jsou uvedeny v obrázku 3 pouze
jako doplňující informace pro zájemce, a nemají být interpretovány jako doklad o
validizaci. Fakt, že hodnoty odlišnosti matice voličských přesunů z exit-pollového šetření SC&C pouze mezi voliči jsou srovnatelné s odlišnostmi mezi odhady
z Evropské volební studie a z ekologického usuzování (11,3), naznačuje, že zjištěný
rozdíl ve velikosti matice nemá příliš velký zkreslující účinek.
Srovnáním políček matic voličských přesunů, která jsou uvedena ve spodní části tabulek 2, 3 a 4, zjišťujeme, že obecně přinášejí obě hromadná šetření vyšší odhad
stranické loajality než ekologické usuzování. Kromě toho údaje v tabulkách 2 a 4
prokazují, že metoda ekologického usuzování nadhodnocuje neúčast v roce 2004
u těch, kteří se zúčastnili voleb v roce 2002. Tyto rozdíly bychom mohli připsat na
vrub nadhodnocování volební účasti a konzistence stranické podpory v dotazníkových šetřeních. Dokladem pro takovouto interpretaci je skutečnost, že Evropská
volební studie [2004] nadhodnocuje volební účast. Naproti tomu průzkum SC&C
(tabulka 3) poskytuje nesprávný odhad volebního chování v roce 2002. Obě tato
zkreslení jsou typická pro retrospektivní dotazování o volebních rozhodnutích a
jsou zdrojem systematické chyby.
Ze všech těchto důvodů je zřejmé, že odhady voličských přesunů na základě
dotazníkového šetření budou zatíženy náhodnou i systematickou chybou – klíčo- 72 -
vým problémem je velikost těchto zdrojů chyb. U metody ekologického usuzování
je klíčovým problémem vyčíslení systematické chyby způsobené předpoklady ve
statistickém modelování. Teoreticky by systematická chyba měla být v řádně specifikovaném modelu ekologického usuzování nulová. Vzhledem ke všem těmto
problémům srovnání je důležité zdůraznit, že odhady z ekologického usuzování
se nijak zásadně neliší od odhadů z obou šetření. Zdá se proto rozumné, abychom
s ohledem na neexistenci definitivnějšího postupu valorizace a bez nároku na úplnou správnost přijali následující závěr: můžeme se s přiměřenou jistotou domnívat,
že se odhady z ekologického usuzování pravděpodobně blíží skutečným hodnotám
voličských přesunů.
Závěr
Agregovaná data o lidském chování jsou pro sociální vědce rozšířeným a nedocenitelným zdrojem informací. Klíčovým problémem při použití těchto dat a správném
usuzování o příčinných vztazích je, aby výzkumník konkretizoval úroveň prováděné
analýzy a testovanou teorii. V sociálních vědách je řada sociálně psychologických
a ekonomických teorií založena na vysvětlení individuálních, a nikoli skupinových
jevů. Chce-li tedy analytik použít k ověření teorií vysvětlujících individuální chování agregovaná data, pouští se do usuzování mezi různými úrovněmi. Usuzování
napříč úrovněmi je složitá činnost, protože souvislosti mezi proměnnými zjištěné
na individuální a agregované úrovni většinou nejsou shodné. To představuje problém ekologického usuzování.
K překonání problému ekologického usuzování a provádění usuzování napříč
úrovněmi je možné použít statistické metody. Takovéto metody jsou vždy založeny
na předpokladech o (1.) rozdělení dat na individuální úrovni, která vedou ke sledovaným agregovaným vzorcům, (2.) vztahu mezi sledovanými proměnnými a o
(3.) odhadovaných parametrech modelu. V tomto článku jsem představil a kriticky
přezkoumal řadu statistických metod usuzování napříč úrovněmi.
V oblasti volebních výzkumů byla použita technika latentní struktury pro
ekologické usuzování z oficiálních výsledků na úrovni okresů. Konkrétně byly
zkoumány voličské přesuny mezi dvěma po sobě jdoucími volbami. V této souvislosti byly přezkoumány odhady voličských přesunů na individuální úrovni
získané ekologickou analýzou s ohledem na očekávání odvozená z konkrétní
teorie – teorie voleb druhého řádu. Jelikož jsou veškeré metody ekologického
usuzování založeny na určitých předpokladech, je nezbytně nutné ověřit validitu
těchto předpokladů pomocí dat jiného druhu, obvykle pomocí dat z šetření na
individuální úrovni.
Závěrem doufám, že tento stručný přehled usuzování napříč úrovněmi, ve
kterém jsem uplatnile statistické metody v politologické perspektivě, povzbudí
výzkumníky k plodnějšímu využívání úředních statistik a jiných zdrojů agregovaných dat při ověřování modelů individuálního chování. V metodách ekologického
usuzování se skrývá potenciál pro rozšíření a prohloubení vědeckého porozumění
individuálnímu jednání nad rámec analytických nástrojů, které obvykle umožňují
hromadná šetření. Společné využití datových souborů na individuální a agregované úrovni představuje důležitou příležitost pro ověření a rozšíření stávajících teorií
o předmětu, času, způsobech a příčinách lidského chování.
- 73 -
Literatura:
Achen, C.H., Phillips W. Shively. 1995 Cross-level Inference. Chicago, IL: University of
Chicago Press.
Anselin, L. 2000. „The alchemy of statistics, or creating data where no data exists“. Annals of the Association of American Geographers 90(3): 586-592.
Berglund, S., S.R. Thomsen.1990. Modern Political Ecological Analysis. Copenhagen:
Abo Academic Press.
Campbell, A., P.E. Converse, W.E. Miller, D. Stokes. 1960. The American Voter. New
York: Wiley.
Cho, W. 1998. „If the assumption fits: A comment on the King ecological inference solution“. Political Analysis 7: 143-163.
Duncan, O.B., B. Duncan. 1955. „Residential distribution and occupational stratification“.
American Journal of Sociology 20: 210-217.
Fiorina, M. 1981. Retrospective Voting in American Elections. New Haven, CN: Yale University Press.
Fotheringham, A.S. 2000. „A bluffers guide to A Solution to the Ecological Inference Problem“. Annals of the Association of American Geographers 90(3): 582-586.
Freedman, D.A., S.P. Klein, M. Ostland, M.R. Roberts. 1998. „Review of ‘A Solution to
the Ecological Inference Problem (by G. King)“. Journal of the American Statistical
Association 93: 1518-1522.
Gill, J. 2008. Bayesian Methods: A Social and Behavioural Sciences Approach (Second
Edition). Boca Raton, FL: Chapman & Hall/CRC.
Goodman, L. 1959 „Some alternatives to ecological correlation“. American Journal of
Sociology 64: 610-624.
King, G. 1996. „Why context should not count“. Political Geography 15: 159-164.
King, G. 1997. A Solution to the Ecological Inference Problem: Reconstructing Individual Behavior from Aggregate Data. Princeton, NJ: Princeton University Press.
King, G., O. Rosen, M.A. Tanner (eds.). 2004. Ecological Inference: New Methodological
Strategies. New York: Cambridge University Press.
Kostelecký, T., D.Čermák. 2003. „Surveys and aggregate data analysis, a discussion of
the usability of different approaches in a comparative analysis of political behaviour“.
Sociologický časopis/Czech Sociological Review 39(4): 529-50 (in Czech).
Kostelecký, T., D. Čermák. 2004. „The influence of territorially specific factors on the formation of the political attitudes of voters“. Sociologický časopis/Czech Sociological
Review 40(4): 469-487 (in Czech).
Linek, L., P. Lyons. 2007a. „What can ecological inference tell about the Second-Order-Election-Thesis in the Czech Republic and Slovakia“. Pp. 327-370 in: Marsh M.,
Mikhalyov S. and Schmitt H. (eds.): European Elections after Eastern Enlargement:
Preliminary Results from the European Election Study 2004. Mannheim: University
of Mannheim, Mannheim Centre for European Social Research (MZES), Connex Report Series No. 01.
Linek, L., P. Lyons. 2007b. „Přesuny voličů ve volbách do Evropského parlamentu v roce
2004 v České republice: Testování nĕkeyterých implikací teorie národních voleb druhého řadu“. Pp. 249-264 in: Linek L. and Outly J. a kol. (eds.): Volby fo Evropského
parlamentu 2004. Praha: Sociologický ústav Akademie vĕd ČR, v.v.i. a Fakulta humanitích studií Univerzita Hradec Králové.
Linek, L., P. Lyons. 2008. „Is the Nationalisation of Politics Fact or Artefact? Evidence
from the Czech Republic“. Paper presented at the European Consortium for Politi-
- 74 -
cal Research (ECPR) Joint Sessions, Institut d’Etudes Politiques de Rennes, France,
April 11-16 2008.
Lebeda, T., a kol. 2007. “Závĕr: Co rozhodlo volby do Poslanecké snĕmovny v roce 2006
a co jsme se dozvĕdĕli o volebním chování v ČR?” Pp. 203-214 in: Lebeda T., Linek L.,
Lyons P. a Vlachová K (eds.): Voliči a Volby 2006. Praha: Sociologický ústav Akademie vĕd ČR, v.v.i.
Lewis-Beck, M. 1988. Economics and Elections. Ann Arbor, MI: Univ.of Michigan Press.
Lyons, P., L. Linek. 2007. „Tematické hlasovaní, vliv lidrů a stranictví ve volbách“. Pp.
177-202 in: Lebeda T., Linek L., Lyons P. a Vlachová K (eds.): Voliči a Volby 2006.
Praha: Sociologický ústav Akademie vĕd ČR, v.v.i.
Margolis, M., Book reviews of Thomsen’s (1987). 1998. „Danish Elections 1920-1979: A
Logit approach to Ecological Analysis and Inference“. Journal of Mathematical Sociology, 1988, 13(4), 429-31.
Ogburn, W.F., I. Goltra. 1919. „How women vote“. Political Science Quarterly 34(3): 413433.
Reif, K.H., H. Schmitt. 1980. „Nine second order national elections: A conceptual framework for the analysis of European election results“. European Journal of Political
Research 8: 3-44.
Robinson, W.S. 1950. „Ecological correlations and the behaviour of individuals. American Sociological Review 15: 351-357.
Rosen, O., W. Jiang, G. King, M.A. Tanner. 2001. „Bayesian and frequentist inference for
ecological inference: the R × C case“. Statistica Neerlandica 55(2), 134-156.
Sakoda, J.M. 1981. „A generalized index of dissimilarity“. Demography 18(2): 245-250.
Schumpeter, J.A. 1976 (1942). Capitialism, Socialism and Democracy. New York: Harper
and Row.
Taylor, C., S. Gorard, J. Fitz. 2000. „A re-examination of segregation indices in terms of
compositional invariance“. Social Research Update, Department of Sociology, University of Surrey, Vol. 30.
Thomsen, S.R. 1999. „Ecological inference with the multiple logit model“. Working
Paper, Department of Political Science, Aarhus University, Universitetsparken, DK8000 Denmark, February 1999.
Thomsen, S.R. 2000. „Issue voting and ecological inference“. Working Paper, Department of Political Science, Aarhus University, Universitetsparken, DK-8000 Denmark,
September 2000.
Thomsen, S.R. 1987. Danish Elections 1920-1979: A Logit approach to Ecological Analysis and Inference. Arrhus: Politica.
Thomsen, S.R., S. Berlund, I. Wörlund. 1991. ‘Assessing the validity of the logit method
for ecological inference,’ European Journal of Political Research 19, 441-477.
Thomsen, S.R. 2003. „Ecological unstandardised factor and pooled regression analysis“.
Paper presented at Meeting of Democratic Participation and Political Communication in Systems of Multi-level Governance Research Group, EU FP5 Programme,
Dublin, Ireland, January 14, 2003.
Tourangeau, R., L.J. Rips, K. Rasinski. 2000. The Psychology of Survey Response. Cambridge: Cambridge University Press.
Wakefield, J. 2004. „Ecological inference for 2 x 2 tables“. JR. Statist. Soc. A 167: 385445.
Wright, G.C. 1993. „Errors in measuring vote choice in National Election Studies, 195288“. American Journal of Political Science: 37(1): 291-316.
- 75 -

PDF článku ke stažení… - Data a výzkum

Transkript

Podobné dokumenty

příloženém souboru

vybrané metody vícerozměrné statistiky

Jak Začít - Synergy Pulse

Wiliam Saroyan

nanofyzika (nf)

EP - zlom

listopad 2008

β β β ∑ ∑ ∑

UNICORN COLLEGE BAKALÁŘSKÁ PRÁCE