Teorie her a Nashova rovnováha
Přihlásit se
Teorie her a Nashova rovnováha (2/4) · 6:31

Více o Nashově rovnováze Podrobnější pohled na definici Nashovy rovnováhy

Navazuje na Druhy konkurence.
Myšlenka Nashovy rovnováhy je důležitá a myslím si, že si zaslouží vlastní video. A možná jste nevěděli, že jde o Johna Nashe, kterého hrál Russel Crowe ve filmu Čistá duše. Je to koncept teorie her, teorie her zní velmi vznešeně, ale doopravdy je to jen teorie her. Vězňovo dilema, o kterém jsme mluvili v předchozí lekci, je skutečně hra. Různí hráči mají různé strategie a na základě ovlivňujících se strategií se můžete dostat k různým výsledkům... a dosáhnout různých výstupů. Tady je definice Nashovy rovnováhy z Princetonu. Je to dobré místo, z kterého si vzít definici, John Nash zde strávil pořádný kus kariéry. Definice zní: "Je to vyrovnaný stav systému, zahrnující několik na sebe navzájem působících účastníku a v našem Vězňově dilematu jsme měli 2 účastníky, kde žádný z účastníků nemůže získat změnou strategie, pokud zůstavají ostatní účastníci beze změny. Zamysleme se nad různými stavy tohoto systému, který je zde. Podívejme se, zda některý z nich plní tuto podmínku. Označím tento jako 1... toto je stav 1, toto 2, tento 3 a toto je stav 4. Tedy pokud se nacházíme ve stavu 1, může kterýkoliv účastník něco získat změnou strategie za předpokladu, že zůstanou ostatní beze změny? Jsme ve stavu 1, kdy Al zapírá a Bill zapírá, ale Al může zlepšit svou situaci změnou strategie. Může místo zapírání, což je tento scénář, přejít k přiznání. Al může změnit svou strategii a získat nebo nebo na to může jít opačně za předpokladu, že Bill pokračuje v zapírání nebo se můžete vydat opačnou cestou. Pokud jsme ve stavu 4 a předpokládáme, že Al se nemění, Bill může zlepšit svou situaci tím, že místo zapírání se přizná. Můžeme se dostat ze 2 let na 1 rok. Z obou těchto důvodů, pokud by oba byly pravdivé, nebyla by to Nashova rovnováha, ale oba z nich jsou pravdivé, tak to rozhodně není Nashova rovnováha. Dávám 2 příklady, ve kterých jeden účastník může získat změnou strategie, pokud další účastník zůstane nezměněn. Tento krok byl jeden příklad a je to krok Ala, zatímco Bill se odmítá přiznat. To byl krok Billa, zatímco Al se odmítá přiznat. Ne Nashova rovnováha. Teď pojďme přemýšlet o stavu 2. Pokud budeme mít stav 2, za předpokladu, že Bill je konstantní, může Al změnou zlepšit svůj výsledek. Ve stavu 2 dostane Al maximálně 1 rok. Pokud se Al rozhodne místo přiznání zapírat, dostane 2 roky. Al nemůže změnit svou strategii a získat. Dosud to vypadá dobře. Ale zamysleme se nad tím z pohledu Billa. Pokud jsme ve stavu 2 přímo tady a předpokládáme, že Al je nezměněn, může Bill udělat něco, co věci změní. Jsme si jisti, že Bill může přejít od zapírání k přiznání. Pokud přejde od zapírání k přiznání, dostane se z 10 let ve vězení na 3 roky ve vězení. Dávám příklad účastníka, který může získat změnou strategie tak dlouho, dokud všichni ostatní účastníci zůstanou nezměněny. Oba z nich nemusí být schopni to udělat. Potřebujete pouze jednoho z nich, aby to nebyla Nashova rovnováha. Protože Bill může získat změnou strategie, zatímco Alova strategie je neměnná... Zatímco je Alova strategie přiznat se, není to Nashova rovnováha. Protože díky této změně, se to může stočit k daleko příznivější situaci pro Billa, zatímco Al zůstává nezměněn. Teď pojďme do stavu 3. Zamysleme se nad tím. Dosud ve stavu 3... tohle je Billovo přiznání a Alovo zapírání. Nejprve se nad tím zamyslíme z pohledu Ala. Pokud předpokládáme, že Bill je neměnný ve své výpovědi, může Al zlepšit svůj scénář. Jsme si jisti, že může přejít z popírání, což je to, co musí být ve stavu 3, k přiznání. Může se posunout tímto směrem. A to samo o sobě není dostatečný důkaz, není to Nashova rovnováha. Nemusíme se zamýšlet nad Billem, to je metrické, v tomto scénáři nemůže Bill udělat nic, zatímco Al zůstává neměnný, co by věci zlepšilo. Bill se neposune odsud sem, ale jen díky tomu, že Al se může posunout odsud sem, zatímco Bill zůstává neměnný, vám říká, že tohle není Nashova rovnováha. Nyní pojďme na scénář 4 a vy víte, kam to směřuje, pokud jste viděli minulé video. Nyní to bude trochu detailnější. Ve stavu 4 se oba oba přiznají. Podíváme se na to z pohledu Ala, zatímco Bill zůstává neměnný. Zůstáváme v tomto rohu, předpokládáme, že Bill se přiznává. Z pohledu Ala, pokud jsme ve stavu 1, může změnit svou strategii, aby dosáhl lepšího výsledku? Jediná věc, kterou může udělat, je přejít od přiznání k zapírání, ale to nebude dobré. Dostane ne 3 roky ale 10 let. Al nemůže nic získat změnou strategie, pokud všichni ostatní účastníci zůstávají nezměněni. Nyní se nad tím zamyslíme z pohledu Billa. Jsme v tomto stavu, budeme předpokládat, že Al je neměnný. Al je v režimu přiznání, pro Billa ve stavu 4, který se přiznává, je jediná možnost zapírat. Ale tím dostane ne 3 roky ve vězení ale 10 let ve vězení. Nic tím nezíská, takže jsme našli stav, stav 4, ve kterém nikdo z účastníků nemůže získat změnou strategie, pokud zůstávají všichni účastníci nezměneni. A tahle část je důležitá, protože, neříkáme, že oba se mohou změnit současně. Nebyli jste v této matici hry umožňující diagonální pohyb. Žádný z účastníků nemůže získat, ani Al ani Bill zatímco ten druhý zůstává neměnný. Tohle je Nashova rovnováha, Tohle tady a tohle je vyrovnaný stav.
video