Teorie her
Transkript
Teorie her
Teorie her Tomáš Moutelík, Václav Raida, Vladimír Sedláček Úvod do teorie her Teorie her je, formálně řečeno, disciplína aplikované matematiky analyzující široké spektrum konfliktních rozhodovacích situací, jež mohou nastat kdekoliv, kde dochází ke střetu zájmů. Herně-teoretické modely se snaží tyto konfliktní situace analyzovat a sestavením matematického modelu daného konfliktu a pomocí výpočtů nalézt co nejlepší strategie pro konkrétní účastníky. Ač to nemusí být na první pohled patrné, teorie her je dobrým příkladem toho, že matematika není jen teoretickou záležitostí, ale lze ji úspěšně aplikovat v praxi. Teorie her se uplatňuje v ekonomii (burzy, podnikání), diplomacii (mezinárodní jednání), politologii, sociologii, biologii (genetická biologie, evoluční biologie),. . . Například Nashova rovnováha byla použita při analýze válečných konfliktů a závodů ve zbrojení nebo také ke studiu možností kooperace lidí s různými preferencemi. Za povšimnutí stojí, že vznik a rozvoj teorie her není jen zásluhou matematiků, ale i mnoha ekonomů a několika politiků. Je patrné, že výzkum na tomto poli byl prováděn ze zcela praktických důvodů – svědčí o tom už jen fakt, že první zmínka se týká hazardu. Historie, osobnosti James Waldegrave Britský velvyslanec. Ve svém dopise z roku 1713 popisuje strategii ke karetní hazardní hře Le Her. Tento dopis je považován za první zmínku o teorii her. James Madison Čtvrtý americký prezident. Jako první popsal, jaké chování lze očekávat při různých systémech ohodnocení. V podstatě se jedná o problém na způsob vězňova dilematu. Antoine Augustin Cournot Francouzský filosof a matematik, profesor analýzy a matematiky. Jako první zavedl v roce 1838 do ekonomické analýzy funkce a pravděpodobnost. Odvodil pravidlo pro nabídku a poptávku v závislosti na ceně a vytvořil pro ně grafy. Zabýval se rovněž tržním systémem, kde existují pouze dva konkurenti – tím v podstatě vytvořil zjednodušenou verzi Nashovy rovnováhy. Jonhn von Neumann Maďarsko americký matematik. Kromě matematiky se zabýval fyzikou a ekonomií. Je považován za zakladetele teorie her. I přes analýzy Cournota a Waldegravea neexistovala teorie her jako samostatný obor do doby, než Neumann roku 1928 publikoval series of papers. Svou práci završil v roce 1944 vydáním knihy Teorie her a ekonomického chování (originální název: Theory of Games and Economic Behavior ), kterou napsal společně s Oskarem Morgensternem. Toto dílo obsahuje metodu pro nalezení vzájemně konzistentních řešení pro hry dvou osob s nulovým součtem. V této době se teorie her soustředila především na kooperativní hry. Analyzovaly se strategie pro skupiny jednotlivců za předpokladu, že mezi sebou mohou uzavírat dohody o vhodných strategiích. Vězňovo dilema V roce 1950 se objevila první diskuze o vězňově dilematu. Společnost RAND (Research and Development) provedla na toto téma experiment. 1 John Forbes Nash (1928) Americký matematik, profesor na Princetonské univerzitě. Zhruba ve stejnou dobu vytvořil kritérium známé jako Nashova rovnováha, jenž se dá aplikovat na více druhů her než kritérium vytvořené Morgensternem a von Neumannem. Rovnováha je dostatečně obecná, aby umožnila i analýzu nekooperativních her. Touto dobou Nash několikrát krátce pracoval pro již zmíněnou RAND corporation. O Několik let později, kdy se John Nash ocitá na vrcholu své kariéry, se u něj začala projevovat těžká choroba, kterou lékaři diagnostikovali jako paranoidní schizofrenii. Nash například věřil, že s ním prostřednictvím novin komunikují obyvatelé jiných galaxií. Podstoupil řadu terapií, které však nebyly příliš úspěšné, některé jeho stav dokonce zhoršily. I přesto Nash dokázal dále publikovat různé vědecké práce, to trvalo až do roku 1967, kdy se na třicet let publikačně odmlčel. Chorobu se nikdy nepodařilo úplně vyléčit, Nashovi ovšem pomohla pomoc princetonské fakulty matematiky a výpočetního centra, které mu umožnily využívat prostředky univerzity pro různé výzkumy. Velmi prospěšným se také ukázalo začlenění do komunity, která měla pochopení pro jeho výstřednosti. Od 80. let začal John Nash prostřednictvím elektronické pošty komunikovat s odbornou veřejností, která tak měla možnost zjistit, že jeho práce mají význam a hodnotu. Tato skupina matematiků Nashe navrhla jako kandidáta na Nobelovu cenu za ekonomii, kterou získal roku 1994. Za zmínku rovněž stojí Nashovo manželství. Jeho žena Alishia, se kterou má syna, v době, kdy Nash podstupoval nejrůznější terapie, pracovala mimo jiné jako programátorka, což tehdy bylo ještě méně obvyklé než dnes. Později (1963) se rozvedli, ovšem v roce 1970 se k sobě vrátili a roku 2001 se opět stali manžely. Dá se říci, že bez Alishii, která mu v nejtěžších chvílích pomáhala především se začleňováním do komunity a přesvědčovala fakultu o smyslu a významu jejich pomoci, by se John Nash neobešel. Od 90. let se Johnu Nashovi daří úspěšně zvládat projevy své těžké choroby. V současné době se zabývá pokročilou teorií her a stále doufá, že se mu podaří nové významné vědecké objevy. John Nash je člověk s velmi zajímavým životním osudem. Díky tomuto osudu je mezi laickou veřejností jedním z nejznámějších matematiků, zásluhu na tom má také kniha, kterou o něm napsala Sylvie Nasar a především stejnojmenný film Čistá duše, jenž byl natočen podle knižní předlohy a získal čtyři Oscary. Zpět do 50. let Teorie her zaznamenává velký rozmach. Byly vyvinuty koncepty opakovaných her, fictious play, extensive form game, Shapley value. Objevily se první aplikace ve filosofii a politologii. Reinhard Selten Německý ekonom. Za vyřešení Subgame perfect equilibrium získal v roce 1994 Nobelovu cenu za ekonomii. John Harsanyi Maďarsko-australsko-americký ekonom. V roce 1967 vyvinul koncept her s úplnými informacemi a koncept bayesovských her. Za vysoce inovativní analýzu bayesovských her získal roku 1994 Nobelovu cenu za ekonomii. John Manard Smith Britský teoretický evoluční biolog a genetik. V roce 1970 byla především jeho zásluhou teorie her aplikovaná na biologii díky strategii stabilní evoluce, kterou vytvořil. 2 Thomas Schelling, Robert Aumann Americký ekonom a profesor. Izraelsko-americký matematik. V roce 2005 získali Nobelovu cenu za ekonomii. První z nich pracoval na evoluční teorii her. Druhý rozvinul různé rovnováhy. Roger Myerson, Leonid Hurwicz, Eric Maskin Američtí ekonomové. V roce 2007 získali Nobelovu cenu za položení základů Mechanism design (reverse game theory). Typy her, příklady, analýza Pod pojmem hra si většina lidí představí šachy, blackjack, ruletu, apod. kde jeden hráč vyhrává/prohrává o tolik, o kolik prohrávají/vyhrávají ostatní hráči (nebo kasino). Jedná se o konečné hry s nulovým součtem. Například již zmiňované šachy jsou ještě navíc hrou s úplnými informacemi – oba hráči mají k dispozici stejné informace týkající se hry. Naopak poker je případ hry s neúplnými informacemi – každý hráč má informace pouze o tom jaké karty má na ruce, o kartách protihráčů neví prakticky nic. Hry s neúplnými informacemi se nazývají bayesovské hry. V reálných situacích se mnohem více vyskytují bayesovské hry s nenulovým součtem – zisk jednoho hráče nemusí nutně znamenat ztrátu pro ostatní hráče (oba mohou získat, oba mohou ztratit). Příklady: politika, podnikání. Jedním z nejjednodušších a nejznámějších příkladů je takzvané vězňovo dilema. Nashova rovnováha Korektní definice vyžaduje vcelku pokročilou matematiku, proto se přidržíme jen definice neformální. Nashova rovnováha je, zjednodušeně řečeno, stav, kdy žádný z hráčů nemůže na základě znalosti pevně zvolených strategií ostatních hráčů svou strategii vylepšit. Nashova rovnováha je tedy nejlepší možná reakce na strategie ostatních hráčů. John Nash dokázal, že každá konečná hra má alespoň jedno takové řešení. Zbývá poznamenat, že Nashova rovnováha se používá pro hry s úplnou informací. Pro hry s neúplnou informací se užívá Bayesovo-Nashovo ekvilibrium, které má navzdory odlišné struktuře her stejnou ideu. Vězňovo dilema Nyní se konečně dostáváme k v různých případech již několikrát zmíněnému vězňovu dilematu. O co se jedná? Byli zatčeni dva lidé – hráč A a hráč B. Každý má dvě možnosti, buď bude svědčit proti druhému hráči, anebo bude mlčet. V případě, že oba hráči mlčí, nedá se jim nic velkého dokázat, ale za pár drobností bude každý z nich odsouzen na šest měsíců. V případě, že oba usvědčí druhého hráče, půjde každý sedět na pět let. Konečně jestliže jeden promluví a druhý bude mlčet, ten který mluvil bude propuštěn na svobodu a druhý hráč půjde sedět na deset let. Máme dva hráče, každý má dvě možnosti, celkem tedy mohou nastat čtyři různé situace. Zapíšeme si je do jednoduché tabulky níže. Jen pro úplnost: vězňovo dilema je příklad konečné hry s neúplnými informacemi a nenulovým součtem. Hráč A mluví: Hráč B mluví: Oba hráči dostanou 5 let. Hráč B mlčí: Hráč B dostane 10 let. Hráč A bude volný. 3 Hráč A mlčí: Hráč A dostane 10 let. Hráč B bude volný. Oba hráči dostanou 6 měsíců. Nyní si položme otázku, co je pro každého z hráčů nejvýhodnější. Na první pohled by se nám mohlo zdát, že je to jistě situace, kdy budou oba mlčet. Každý si odsedí šest měsíců, nikdo nebude z ničeho usvědčen, součet obou pobytů ve vězení bude jeden rok, což je desetkrát méně, než kdyby oba mluvili nebo kdyby jeden mluvil a druhý mlčel. Ovšem zdání klame. Pokud se oba hráči budou rozhodovat zcela racionálně, rozhodnou se oba mluvit a každý si odsedí pět let. Jak je to možné? Podívejme se na celou situaci z pohledu hráče A: „Jestliže budu mlčet, odsedím si buď šest měsíců, nebo deset let. Jestliže budu mluvit, odsedím si pět let nebo budu volný.ÿ Hráč A si nevybírá jednu ze čtyř situací, ale pouze jeden ze dvou sloupců. Sloupec se součtem 5 let je jistě výhodnější než sloupec se součtem 10,5 let. Hráč B je na tom úplně stejně. Vybírá si jeden ze dvou řádků, výhodnější je řádek s nižším součtem. Na problém se také můžeme podívat jako na hledání Nashovy rovnováhy. Oba hráči zvolí mlčení. Nyní se podíváme na jednoho hráče: „Mám možnost změnit svou strategii tak, abych dopadl lépe?ÿ Odpověď zní „Ano.ÿ Druhý hráč zvolil mlčení, proto se prvnímu vyplatí vypovídat, být volný je výhodnější než půl roku. Nyní jsme se dostali do situace, kdy jeden hráč mlčí a druhý mluví. Hráč, který mluví svou strategii nemůže změnit k lepšímu, lépe už dopadnout nemůže. Hráč, který mlčí ovšem svou strategii vylepšit může – pokud by i nadále mlčel, dostal by deset let, pokud promluví, půjde jen na pět, strategii proto změní na mluvení. Nyní oba hráči mluví a ani jeden z nich již svou strategii nemůže vylepšit, místo pěti let by tím získal deset. Nashova rovnováha je případ, kdy oba mluví. Paretovo optimum Celý problém vězňova dilematu je založen na předpokladu, že hráči sledují pouze osobní prospěch. Pokud by oběma hráčům záleželo nejen na sobě ale i na druhém hráči, zvolili by oba mlčení – nejmenší možný součet – to se nazývá Paretovo optimum. Tento stav je pojmenován po italském sociologovi, politologovi a ekonomovi jménem Vilfredo Frederico Damaso Pareto žijícím v 19. a 20. století. Týká se především ekonomického stavu společnosti, ale můžeme o něm hovořit i v našem případě. Zjednodušeně řečeno se jedná o takový stav, kdy žádný jedinec nebo skupina již nemůže dosáhnout lepšího postavení bez toho, aby se postavení někoho jiného zhoršilo. Pokud tedy oba vězni mlčí, může jeden z nich dosáhnout lepšího výsledku pro sebe jen na úkor vězně druhého. Při pokusech prováděných ohledně vězňova dilematu společností RAND zhruba 40% testovaných vykazovalo kooperativní chování (mlčeli) – přišlo jim tedy lepší upřednostnit prospěch celku před jejich vlastním prospěchem. Zajímavé je, že Paretovo optimum nemusí být nutně spravedlivé. Pokud máme společnost, kde je část lidí velmi bohatá a část lidí velmi chudá, jedná se také o optimum – ani bohatý ani chudý již nemůže zbohatnout, aniž by tím někdo jiný zchudl, to ovšem nic nemění na špatném postavení chudší části obyvatelstva. Případ, kdy by se zvýšil blahobyt některé osoby, aniž by se snížil blahobyt osoby jiné se nazývá Paretovo zlepšení. Na Paretovu práci jsme se podívali jen velmi stručně, nicméně i tato malá část nám může postačit k tomu, abychom si uvědomili, jak moc je realita s těmito velmi zajímavými modely teorie her propojena. 4