Teorie her

Transkript

Teorie her
Teorie her
Tomáš Moutelík, Václav Raida, Vladimír Sedláček
Úvod do teorie her
Teorie her je, formálně řečeno, disciplína aplikované matematiky analyzující široké spektrum
konfliktních rozhodovacích situací, jež mohou nastat kdekoliv, kde dochází ke střetu zájmů.
Herně-teoretické modely se snaží tyto konfliktní situace analyzovat a sestavením matematického modelu daného konfliktu a pomocí výpočtů nalézt co nejlepší strategie pro konkrétní
účastníky.
Ač to nemusí být na první pohled patrné, teorie her je dobrým příkladem toho, že matematika není jen teoretickou záležitostí, ale lze ji úspěšně aplikovat v praxi. Teorie her se
uplatňuje v ekonomii (burzy, podnikání), diplomacii (mezinárodní jednání), politologii, sociologii, biologii (genetická biologie, evoluční biologie),. . . Například Nashova rovnováha byla
použita při analýze válečných konfliktů a závodů ve zbrojení nebo také ke studiu možností
kooperace lidí s různými preferencemi.
Za povšimnutí stojí, že vznik a rozvoj teorie her není jen zásluhou matematiků, ale i mnoha
ekonomů a několika politiků. Je patrné, že výzkum na tomto poli byl prováděn ze zcela
praktických důvodů – svědčí o tom už jen fakt, že první zmínka se týká hazardu.
Historie, osobnosti
James Waldegrave Britský velvyslanec. Ve svém dopise z roku 1713 popisuje strategii ke
karetní hazardní hře Le Her. Tento dopis je považován za první zmínku o teorii her.
James Madison Čtvrtý americký prezident. Jako první popsal, jaké chování lze očekávat při různých systémech ohodnocení. V podstatě se jedná o problém na způsob vězňova
dilematu.
Antoine Augustin Cournot Francouzský filosof a matematik, profesor analýzy a matematiky. Jako první zavedl v roce 1838 do ekonomické analýzy funkce a pravděpodobnost.
Odvodil pravidlo pro nabídku a poptávku v závislosti na ceně a vytvořil pro ně grafy. Zabýval se rovněž tržním systémem, kde existují pouze dva konkurenti – tím v podstatě vytvořil
zjednodušenou verzi Nashovy rovnováhy.
Jonhn von Neumann Maďarsko americký matematik. Kromě matematiky se zabýval fyzikou a ekonomií. Je považován za zakladetele teorie her. I přes analýzy Cournota a Waldegravea neexistovala teorie her jako samostatný obor do doby, než Neumann roku 1928
publikoval series of papers. Svou práci završil v roce 1944 vydáním knihy Teorie her a ekonomického chování (originální název: Theory of Games and Economic Behavior ), kterou napsal
společně s Oskarem Morgensternem. Toto dílo obsahuje metodu pro nalezení vzájemně
konzistentních řešení pro hry dvou osob s nulovým součtem. V této době se teorie her soustředila především na kooperativní hry. Analyzovaly se strategie pro skupiny jednotlivců za
předpokladu, že mezi sebou mohou uzavírat dohody o vhodných strategiích.
Vězňovo dilema V roce 1950 se objevila první diskuze o vězňově dilematu. Společnost
RAND (Research and Development) provedla na toto téma experiment.
1
John Forbes Nash (1928) Americký matematik, profesor na Princetonské univerzitě.
Zhruba ve stejnou dobu vytvořil kritérium známé jako Nashova rovnováha, jenž se dá aplikovat na více druhů her než kritérium vytvořené Morgensternem a von Neumannem. Rovnováha
je dostatečně obecná, aby umožnila i analýzu nekooperativních her. Touto dobou Nash několikrát krátce pracoval pro již zmíněnou RAND corporation.
O Několik let později, kdy se John Nash ocitá na vrcholu své kariéry, se u něj začala
projevovat těžká choroba, kterou lékaři diagnostikovali jako paranoidní schizofrenii. Nash například věřil, že s ním prostřednictvím novin komunikují obyvatelé jiných galaxií. Podstoupil
řadu terapií, které však nebyly příliš úspěšné, některé jeho stav dokonce zhoršily. I přesto
Nash dokázal dále publikovat různé vědecké práce, to trvalo až do roku 1967, kdy se na třicet
let publikačně odmlčel.
Chorobu se nikdy nepodařilo úplně vyléčit, Nashovi ovšem pomohla pomoc princetonské
fakulty matematiky a výpočetního centra, které mu umožnily využívat prostředky univerzity
pro různé výzkumy. Velmi prospěšným se také ukázalo začlenění do komunity, která měla
pochopení pro jeho výstřednosti. Od 80. let začal John Nash prostřednictvím elektronické
pošty komunikovat s odbornou veřejností, která tak měla možnost zjistit, že jeho práce mají
význam a hodnotu. Tato skupina matematiků Nashe navrhla jako kandidáta na Nobelovu
cenu za ekonomii, kterou získal roku 1994.
Za zmínku rovněž stojí Nashovo manželství. Jeho žena Alishia, se kterou má syna, v době,
kdy Nash podstupoval nejrůznější terapie, pracovala mimo jiné jako programátorka, což tehdy
bylo ještě méně obvyklé než dnes. Později (1963) se rozvedli, ovšem v roce 1970 se k sobě
vrátili a roku 2001 se opět stali manžely. Dá se říci, že bez Alishii, která mu v nejtěžších
chvílích pomáhala především se začleňováním do komunity a přesvědčovala fakultu o smyslu
a významu jejich pomoci, by se John Nash neobešel.
Od 90. let se Johnu Nashovi daří úspěšně zvládat projevy své těžké choroby. V současné
době se zabývá pokročilou teorií her a stále doufá, že se mu podaří nové významné vědecké
objevy. John Nash je člověk s velmi zajímavým životním osudem. Díky tomuto osudu je mezi
laickou veřejností jedním z nejznámějších matematiků, zásluhu na tom má také kniha, kterou
o něm napsala Sylvie Nasar a především stejnojmenný film Čistá duše, jenž byl natočen podle
knižní předlohy a získal čtyři Oscary.
Zpět do 50. let Teorie her zaznamenává velký rozmach. Byly vyvinuty koncepty opakovaných her, fictious play, extensive form game, Shapley value. Objevily se první aplikace ve
filosofii a politologii.
Reinhard Selten Německý ekonom. Za vyřešení Subgame perfect equilibrium získal v roce
1994 Nobelovu cenu za ekonomii.
John Harsanyi Maďarsko-australsko-americký ekonom. V roce 1967 vyvinul koncept her
s úplnými informacemi a koncept bayesovských her. Za vysoce inovativní analýzu bayesovských her získal roku 1994 Nobelovu cenu za ekonomii.
John Manard Smith Britský teoretický evoluční biolog a genetik. V roce 1970 byla především jeho zásluhou teorie her aplikovaná na biologii díky strategii stabilní evoluce, kterou
vytvořil.
2
Thomas Schelling, Robert Aumann Americký ekonom a profesor. Izraelsko-americký
matematik. V roce 2005 získali Nobelovu cenu za ekonomii. První z nich pracoval na evoluční
teorii her. Druhý rozvinul různé rovnováhy.
Roger Myerson, Leonid Hurwicz, Eric Maskin Američtí ekonomové. V roce 2007
získali Nobelovu cenu za položení základů Mechanism design (reverse game theory).
Typy her, příklady, analýza
Pod pojmem hra si většina lidí představí šachy, blackjack, ruletu, apod. kde jeden hráč vyhrává/prohrává o tolik, o kolik prohrávají/vyhrávají ostatní hráči (nebo kasino). Jedná se o
konečné hry s nulovým součtem. Například již zmiňované šachy jsou ještě navíc hrou s úplnými
informacemi – oba hráči mají k dispozici stejné informace týkající se hry. Naopak poker je
případ hry s neúplnými informacemi – každý hráč má informace pouze o tom jaké karty má
na ruce, o kartách protihráčů neví prakticky nic. Hry s neúplnými informacemi se nazývají
bayesovské hry.
V reálných situacích se mnohem více vyskytují bayesovské hry s nenulovým součtem – zisk
jednoho hráče nemusí nutně znamenat ztrátu pro ostatní hráče (oba mohou získat, oba mohou
ztratit). Příklady: politika, podnikání. Jedním z nejjednodušších a nejznámějších příkladů je
takzvané vězňovo dilema.
Nashova rovnováha Korektní definice vyžaduje vcelku pokročilou matematiku, proto se
přidržíme jen definice neformální. Nashova rovnováha je, zjednodušeně řečeno, stav, kdy žádný
z hráčů nemůže na základě znalosti pevně zvolených strategií ostatních hráčů svou strategii
vylepšit. Nashova rovnováha je tedy nejlepší možná reakce na strategie ostatních hráčů. John
Nash dokázal, že každá konečná hra má alespoň jedno takové řešení. Zbývá poznamenat, že
Nashova rovnováha se používá pro hry s úplnou informací. Pro hry s neúplnou informací se
užívá Bayesovo-Nashovo ekvilibrium, které má navzdory odlišné struktuře her stejnou ideu.
Vězňovo dilema Nyní se konečně dostáváme k v různých případech již několikrát zmíněnému vězňovu dilematu. O co se jedná? Byli zatčeni dva lidé – hráč A a hráč B. Každý má dvě
možnosti, buď bude svědčit proti druhému hráči, anebo bude mlčet. V případě, že oba hráči
mlčí, nedá se jim nic velkého dokázat, ale za pár drobností bude každý z nich odsouzen na
šest měsíců. V případě, že oba usvědčí druhého hráče, půjde každý sedět na pět let. Konečně
jestliže jeden promluví a druhý bude mlčet, ten který mluvil bude propuštěn na svobodu
a druhý hráč půjde sedět na deset let.
Máme dva hráče, každý má dvě možnosti, celkem tedy mohou nastat čtyři různé situace.
Zapíšeme si je do jednoduché tabulky níže. Jen pro úplnost: vězňovo dilema je příklad konečné
hry s neúplnými informacemi a nenulovým součtem.
Hráč A mluví:
Hráč B mluví:
Oba hráči dostanou 5 let.
Hráč B mlčí:
Hráč B dostane 10 let.
Hráč A bude volný.
3
Hráč A mlčí:
Hráč A dostane 10 let.
Hráč B bude volný.
Oba hráči dostanou 6 měsíců.
Nyní si položme otázku, co je pro každého z hráčů nejvýhodnější. Na první pohled by se
nám mohlo zdát, že je to jistě situace, kdy budou oba mlčet. Každý si odsedí šest měsíců,
nikdo nebude z ničeho usvědčen, součet obou pobytů ve vězení bude jeden rok, což je desetkrát
méně, než kdyby oba mluvili nebo kdyby jeden mluvil a druhý mlčel.
Ovšem zdání klame. Pokud se oba hráči budou rozhodovat zcela racionálně, rozhodnou
se oba mluvit a každý si odsedí pět let. Jak je to možné? Podívejme se na celou situaci
z pohledu hráče A: „Jestliže budu mlčet, odsedím si buď šest měsíců, nebo deset let. Jestliže
budu mluvit, odsedím si pět let nebo budu volný.ÿ Hráč A si nevybírá jednu ze čtyř situací,
ale pouze jeden ze dvou sloupců. Sloupec se součtem 5 let je jistě výhodnější než sloupec se
součtem 10,5 let. Hráč B je na tom úplně stejně. Vybírá si jeden ze dvou řádků, výhodnější
je řádek s nižším součtem.
Na problém se také můžeme podívat jako na hledání Nashovy rovnováhy. Oba hráči zvolí
mlčení. Nyní se podíváme na jednoho hráče: „Mám možnost změnit svou strategii tak, abych
dopadl lépe?ÿ Odpověď zní „Ano.ÿ Druhý hráč zvolil mlčení, proto se prvnímu vyplatí vypovídat, být volný je výhodnější než půl roku. Nyní jsme se dostali do situace, kdy jeden
hráč mlčí a druhý mluví. Hráč, který mluví svou strategii nemůže změnit k lepšímu, lépe už
dopadnout nemůže. Hráč, který mlčí ovšem svou strategii vylepšit může – pokud by i nadále
mlčel, dostal by deset let, pokud promluví, půjde jen na pět, strategii proto změní na mluvení.
Nyní oba hráči mluví a ani jeden z nich již svou strategii nemůže vylepšit, místo pěti let by
tím získal deset. Nashova rovnováha je případ, kdy oba mluví.
Paretovo optimum Celý problém vězňova dilematu je založen na předpokladu, že hráči
sledují pouze osobní prospěch. Pokud by oběma hráčům záleželo nejen na sobě ale i na druhém
hráči, zvolili by oba mlčení – nejmenší možný součet – to se nazývá Paretovo optimum. Tento
stav je pojmenován po italském sociologovi, politologovi a ekonomovi jménem Vilfredo Frederico Damaso Pareto žijícím v 19. a 20. století. Týká se především ekonomického stavu
společnosti, ale můžeme o něm hovořit i v našem případě. Zjednodušeně řečeno se jedná
o takový stav, kdy žádný jedinec nebo skupina již nemůže dosáhnout lepšího postavení bez
toho, aby se postavení někoho jiného zhoršilo. Pokud tedy oba vězni mlčí, může jeden z nich
dosáhnout lepšího výsledku pro sebe jen na úkor vězně druhého. Při pokusech prováděných
ohledně vězňova dilematu společností RAND zhruba 40% testovaných vykazovalo kooperativní chování (mlčeli) – přišlo jim tedy lepší upřednostnit prospěch celku před jejich vlastním
prospěchem.
Zajímavé je, že Paretovo optimum nemusí být nutně spravedlivé. Pokud máme společnost,
kde je část lidí velmi bohatá a část lidí velmi chudá, jedná se také o optimum – ani bohatý ani
chudý již nemůže zbohatnout, aniž by tím někdo jiný zchudl, to ovšem nic nemění na špatném
postavení chudší části obyvatelstva. Případ, kdy by se zvýšil blahobyt některé osoby, aniž by
se snížil blahobyt osoby jiné se nazývá Paretovo zlepšení.
Na Paretovu práci jsme se podívali jen velmi stručně, nicméně i tato malá část nám může
postačit k tomu, abychom si uvědomili, jak moc je realita s těmito velmi zajímavými modely
teorie her propojena.
4