Teorie her a Nashova rovnováha
Teorie her a Nashova rovnováha (1/4) · 9:21

Vězňovo dilema a Nashova rovnováha Vězňovo dilema jako způsobu představení Nashovy rovnováhy

Navazuje na Druhy konkurence.
Ve stejný den policie udělala dvě nejprve nesouvisející zadržení. Zatkli muže jménem Alan. Chytili ho při činu prodávání drog. Takže to je zcela jasný případ. A ve stejný den dopadli muže jménem Bill a taktéž byl chycen při činu prodeje drog. Přivedli je na policejní stanici odděleně a řekli jim, "podívejte se, to je zcela jasný případ, budete odsouzeni za prodej drog a dostanete dva roky." A řekli to každému z nich zvlášť. Náhodou prodávají stejný typ drog. Ale dělali to absolutně nezávisle. Dva roky za drogy je to, co se stane, nic jiného nepředpokládali. Ale potom má státní návladní šanci mluvit s každým z těchto mužů odděleně. A zatímco s nimi mluví, sílí v něm myšlenka, že to je zcela jasný případ prodeje drog. Každý z nich dostane 2 roky, pokud se nic jiného nestane. Ale potom si začne uvědomovat, jak tyhle dva týpci vypadají. Z nějakého důvodu začne mít podezření, že tyto 2 osoby ve skutečnosti spáchaly mnohem závažnější trestní čin, že před pár týdny spáchaly velkou ozbrojenou loupež. A všechno po čem státní návladní jde je jeho předtucha, jeho podezření. Nemá pádné důkazy. Co chce udělat, je vyzkoušet dosáhnout dohody s každým z těchto mužů, takže mají motivaci v podstatě prásknout jeden druhého. Jednomu z nich říká, "podívej se, dostaneš 2 roky za prodej drog, to je jisté". Ale říká "podívej, pokud se přiznáš a druhý ne, potom dostaneš 1 rok a ten druhý muž 10 let". Alovi říká, "podívej, chytli jsme dnes Billa náhodně, pokud se přiznáš, že jsi to byl ty a Bill, kdo provedl ozbrojenou loupež, délka tvého trestu ve skutečnosti klesne ze 2 let na 1 rok. Ale Bill samozřejmě ve vězení stráví více času, zejména proto, že s námi nespolupracuje, nepřiznává se." Ale potom další výrok je taktéž pravdivý: Pokud to popřeš a ten druhý se přizná, otočí se to. Dostaneš 10 let, protože nespolupracuješ a ten druhý, tvůj spolupachatel, dostane snížený trest, dostane 1 rok. To je jako říkat Alovi "podívej, pokud se nepřiznáš, že jsi byl ozbrojený lupič a Bill Tě práskne, potom dostaneš 10 let vězení a Bill dostane pouze 1 rok vězení." A pokud se oba z vás v podstatě přiznáte, oba se přiznáte, dostanete oba 3 roky. Tento scénář se nazývá "vězňovo dilema". Protože za okamžik uvidíme, že je zde pro ně celkově nejvýhodnější scénář, kde se oba nepřiznají a oba dostanou 2 roky. Ale uvidíme, že na základě jejich motivace, předpokládáme, že k sobě nemají nějakou neobvyklou loajalitu a jsou to, jak víte, ostřílení kriminálníci. Nejsou bratři nebo nejsou žádným způsobem příbuzní. Nemají k sobě žádnou loajalitu. Uvidíme, že budou racionálně volit ne, nebo by mohli racionálně volit neoptimální scénář. A k porozumění toho namaluji něco, co se nazývá "matice hry". Dovolte mi to tady udělat pro Billa. Bill má dvě možnosti, může se přiznat k ozbrojené loupeži nebo se nemusí přiznat, že s tím něco měl, že by věděl něco o ozbrojené loupeži. A Al má stejné 2 možnosti. Al se může přiznat a Al se může nepřiznat. A od té doby se to nazývá matice hry, dovolte mi zde nakreslit pár tabulek. A zamysleme se nad všemi odlišnými scénáři a jaké by mohly být hry. Pokud se Al přizná a Bill se přizná, potom jsou ve scénáři 4, oba dostanou 3 roky vězení, oba dostanou 3 pro Ala a 3 pro Billa. Nyní, pokud se Al přizná a Bill se nepřizná, potom jsme ve scénáři 3, z Alova úhlu pohledu, Al dostane 1 rok, ale Bill dostane 10 let. Nyní v případě, že se stane pravý opak, že se Bill přizná a Al se nepřizná, pak to bude opačně. Al dostane 10 let za nespolupráci a Bill bude mít snížený rozsudek o 1 rok za spolupráci. A pokud oba odmítnou, budou ve scénáři 1, kde oba dostanou, co zaslouží za prodej drog. Al dostane 2 roky a Bill dostane 2 roky. O tomto jsem se zmiňoval ve videu dříve. Jaké je pro ně celkově nejvýhodnější scénář? Je to tento scénář, kde oba popírají, že by měli co dočinění s ozbrojenou loupeží, potom dostanou oba 2 roky. Ale uvidíme, že je to ve skutečnosti poněkud racionální za předpokladu, že k sobě navzájem nejsou silně loajální, že nemají vysokou úroveň důvěry k druhé straně, nejít tam, je vlastně racionální pro oba se přiznat. A přiznání je vlastně "Nashova rovnováha". A budeme o tom mluvit více. Ale Nashova rovnováha je, kde si každá strana zvolila možnost danou volbou druhé strany. Když se zamyslíme, nebo když si každá strana zvolila optimální volbu, s ohledem na rozhodnutí, nebo bez ohledu na to jakou volbu si vybere druhá strana. A tak z Alova úhlu pohledu říká, podívejte se, nevím, zda se Bill přizná nebo nepřizná, řekněme že se přiznal, co je pro mě lepší udělat? Pokud se přizná a já se přiznám, potom dostanu 3 roky. Pokud se přizná a já nepřiznám, dostanu 10 let. Pokud se přizná, je lepší pro mě se také přiznat. Tohle je výhodnější scénář než tenhle. Nyní nevím, zda Bill se přiznal, mohl se nepřiznat. Pokud budu předpokládat, že se Bill nepřiznal, je pro mě lepší se přiznat a dostat 1 rok, nebo se nepřiznat a dostat 2 roky? Dobře ještě jednou, je lepší se pro mě přiznat. A tak, bez ohledu, zda se Bill přizná nebo nepřizná, tohle ještě jednou, optimální volba pro Ala vzhledem k Billově volbě je se přiznat. Pokud se Bill přizná, je pro Ala lepší se přiznat, pokud se Bill nepřizná, je pro Ala lepší se přiznat. Nyní se na to podívejme z Billova úhlu pohledu a to je naprosto souměrné. Pokud Bill řekne, dobře nevím, zda se Al přizná, nebo nepřizná. Pokud se Al přizná, mohu se přiznat a dostat 3 roky, nebo mohu odmítnout a dostat 10 let. 3 roky ve vězení je lepší než 10, takže zvolím 3 roky. Pokud vím, že se Al přizná. Ale nevím, zda se Al rozhodně přizná, nemusel by se přiznat. Pokud se Al nepřizná, mohl bych se přiznat a dostat 1 rok, nebo se mohu nepřiznat a dostat 2 roky. Dobře, ještě jednou, mohl bych se chtít přiznat a dostat 1 rok. Pro Billa, vzhledem ke každému scénáři, který by mohl Al zvolit, je pro něj vždy lepší se přiznat. A tohle je zajímavé. Racionálně vyvozují, že by se mohli dostat k tomuto scénáři, k tomuto stavu Nashovy rovnováhy, jako protikladu k tomuto celkově nejvýhodnějšímu stavu. Oba dostanou 3 roky, když se oba přiznají jako protiklad k tomu, že dostanou 2 roky, když se oba nepřiznají. Problém s tímto je nevyrovnaný stav. Pokud jeden z nich přidpokládá, že ten druhý má, pokud to jeden z nich předpokládá, jsou v tomto stavu dočasně. Říkají "vždycky můžu svůj scénář zlepšit změnou mých, změnou toho, co chci udělat". Pokud si Al myslel, že se Bill rozhodně nepřiznal, Ale si může vylepšit okolnosti přesunem z tohoto stavu a přiznáním se a dostane pouze 1 rok. Stejně tak, pokud si Bill myslel, že se třeba Al pravděpodobně nepřizná, uvědomuje si, že se může optimalizovat posunem tímto směrem místo toho, že se nepřizná a dostane 2 a mohl by se posunout tímto směrem. Tohle je nevyrovnaný optimální scénář, ale tato Nashova rovnováha, tento stav tady je vlastně velmi, velmi, velmi vyrovnaný. Pokud předpokládají...to je, je pro každého z nich lepší se přiznat bez ohledu na to, co udělá druhý, a předpokládat že ostatní aktéři si vybrali jejich strategii, není zde motivace pro Billa. Pokud předpokládáte, že všichni ostatní změnili strategii, můžete se pouze pohybovat tímto směrem, pokud jste Bill, můžete také... můžete vycházet z Nashovy rovnováhy přiznání se k nepřiznání se, ale je to pro vás horší, takže byste to nechtěli udělat. Nebo byste se mohli posunout tímto směrem, kde by to byl Al měnící své rozhodnutí. Ale ještě jednou to dá horší výsledek pro Ala, dostanete 3 - 10 let. Tohle je stav rovnováhy, vyrovnaný stav, kde si oba lidé zvolí něco, co není celkově nejvýhodnější.
video