Regrese
Přihlásit se
Regrese (4/10) · 10:35

Minimalizování čtvercové chyby regresní přímky (část 1) V předchozím videu jsme si ukázali, co je to čtvercová chyba regresní přímky. Jak ale najít takovou přímku, aby byl součet čtverců odchylek bodů od této přímky co nejmenší?

Navazuje na Pravděpodobnostní rozdělení.
- V předchozím videu jsme si ukázali, že druhá mocnina odchylky každého z těchto n bodů od přímky dané předpisem y = mx + b je právě tento výraz. V tomto videu se algebraicky doberu k tomuto výrazu, tak abychom s ním mohli provádět další operace. Budeme hledat hodnoty "m" a "b", které minimalizují hodnotu tohoto výrazu. Teď už nás čeká jen spousta algebraických úprav. Budu se ale snažit psát barevně, abychom se v té matematice neztratili. Takže teď jenom přepíšu tenhle výraz. Celé tohle video je vlastně jen o přepisování tohohle výrazu pořád dokola. Jen to trochu zjednoduším pomocí algebry. Tenhle první výraz tady, y1 mínus mx1 + b na druhou, bude čtvercová odchylka prvního bodu od přímky. Takže tady ten první výraz, budu ho psát modře, bude po roznásobení (y1 na druhou) mínus 2y1 krát (mx1 + b) plus (mx1 + b) na druhou. Jenom jsem tu umocnil tenhle dvojčlen. Můžete si představit, že kdyby tu bylo (a mínus b), tak by z toho bylo (a na druhou) - 2ab + (b na druhou). Nic víc jsem neudělal. Teď to budu muset udělat pro každý člen. Každý člen se liší jen indexy x a y. Budu to psát pod sebe, aby to bylo přehlednější. Takže tenhle člen na druhou bude (y2 na druhou) mínus 2y2 krát (mx2 + b) plus (mx2 + b) na druhou. Úplně to samé. Kromě toho, že teď šlo o x2 a y2, a ne x1 a y1. A pak to zopakujeme n krát. A pak to zopakujeme n krát. Uděláme to pro třetí člen, x3, y3 a tak dále, a tak dále. Až dokud se nedostaneme tady k tomu n-tému členu. a tenhle n-tý člen po umocnění na druhou bude (yn na druhou) mínus 2yn krát (mxn + b) plus (mxn + b) na druhou. Teď chci rozvést tenhle výraz trochu víc. Takže posuňme se. Celý tenhle výraz, který ještě jednou přepíšu, je vlastně - a to si zapamatujte - součet čtvercových odchylek bodů od regresní přímky. Přepíšu tenhle horní řádek. Tenhle horní řádek je y1 na druhou. A teď roznásobím tuhle závorku. Takže to bude mínus 2y1mx1, jen jsem roznásobil závorku. Mínus 2y1b. Mínus 2y1b. A teď roznásobíme (mx1 plus b) na druhou. To tedy bude (m na druhou krát x1 na druhou) + + (2 krát mx1 krát b) + (b na druhou). Jen jsem použil vzorec (a + b) na druhou, což je (a na druhou) + 2ab + (b na druhou). A uděláme to pro každý ze členů. Nebo bychom taky mohli říct pro každou z těchto barviček. Teď se vrhneme na druhý výraz. Bude to to samé. Ale místo y1 a x1 tu bude y2 a x2. Takže to je (y2 na druhou) mínus 2y2mx2 mínus 2y2b + (m na druhou krát x2 na druhou) + (2 krát mx2b) + (b na druhou). A tohle budeme dělat až dokud se nedostaneme k n-tému členu. se nedostaneme k n-tému členu. Nebo bychom možná měli říct barvě. Takže tohle bude (yn na druhou) mínus 2ynmxn. Takže tohle bude yn na druhou mínus 2ynmxn. A ani nemusíte přemýšlet. Jenom sem vlastně budeme psát index n. Můžeme se na to podívat. Bude to úplně to samé. Mínus 2ynb + (m na druhou krát xn na druhou) + 2mxnb + (b na druhou). Tak ještě jednou, toto je součet čtvercových odchylek n bodů od přímky. Každého z n bodů od přímky y = mx + b. Podívejme se jestli to můžeme nějak zjednodušit. Pokud to chceme zjednodušit, můžeme tuhle hromadu výrazů sečíst. Sečteme všechny tyhle výrazy. Nejprve sečteme výrazy v tomhle sloupci. Co dostaneme? Bude to (y1 na druhou) + (y2 na druhou) a tak dál až k (yn na druhou). To jsou ty členy tady. Tohle tedy dostaneme. Pak tu máme tenhle společný člen 2m ve všech těchto výrazech. To tedy zapíšu. Takže máme 2m tady, 2m tady, 2m tady. Napíšu kolem prvního součtu závorky. Tohle vzniklo posčítáním přes všechny členy. Pak tu máme mínus 2m krát všechny tyhle členy. Napíšu to barevně, ať vidíte, co dělám. Chci být s touhle matematikou velmi opatrný, abyste nebyli zmatení. Ačkoli tohle jsou jen algebraické úpravy. Když to všechno posčítám, dostanu (y1 na druhou) + (y2 na druhou) až (yn na druhou). Dám kolem toho závorky. A taky tu máme společný člen mínus 2m, mínus 2m, mínus 2m. To můžeme vytknout. Takže to vlastně můžu napsat takhle. Máme mínus 2m, což vytkneme. Po vytknutí nám tu zůstane y1x1. Nebo to můžu nazvat x1y1. To zde zůstane po vytknutí mínus 2m. To zde zůstane po vytknutí mínus 2m. Udělám to jinou barvou. Udělám to jinou barvou. Chci, aby to bylo přehledné. + x2y2 + xnyn + xnyn Všechno to sečteme. Sečteme všech n členů. až k xnyn. Poslední člen je xnyn. Takže tohle je náš součet. Takže součet všech těchto členů je totéž jako tento výraz v závorce. Nyní chceme sečíst tohle. Vidíme, že můžeme vytknout mínus 2b ze všech těchto členů. Dostaneme (mínus 2b) krát (y1 + y2 + ... + yn) ... + yn. ... + yn. Tady ty členy po sečtení dají Tady ty členy po sečtení dají tento výraz. Tak pokračujme. A v dalším videu, protože nám v tomto videu asi vyprší čas, tohle zjednoduším víc. tohle zjednoduším víc. Takže co bude další člen? Pořád stejně. Můžeme vytknout m na druhou. Dostaneme m na druhou krát (x1 na druhou + x2 na druhou... Vlastně jsem je chtěl psát barevně, ale zapomněl jsem. + x2 na druhou + ... + xn na druhou. ... + xn na druhou. Budu psát barevně. toto bylo yn na druhou. a tohle bylo y2 na druhou. Takže přesně tohle. Zpět k poslednímu kroku, který jsme udělali: součet těchhle členů tady je ten výraz tady. A samozřejmě to přičítáme. Takže sem připíšu plus. Už jsme s tímto zjednodušovaním téměř hotovi. Takže tady máme společné 2mb, takže vytkneme 2mb, krát (x1 + x2 + ... + xn). krát (x1 + x2 + ... + xn). Takže součet těchto členů je totéž jako tenhle výraz tady. A konečně: v každém z těchto členů se vyskytuje b na druhou. A kolik tady těch (b na druhou) máme? No máme n řádků, je to tak? Toto je první řádek, druhý řádek, pak dál dál až k n-tému řádku. Takže musíme sečíst (b na druhou) n-krát. Dostaneme tedy prostě (b na druhou) krát n. Takže to jenom napíšeme jako plus n krát (b na druhou). Znovu si připomeňme, o co vlastně jde. Toto jsou vlastně jen algebraické úpravy výrazu, který představuje součet čtvercových odchylek n bodů od přímky y = mx + b Nevypadá to, že bych to moc zjednodušil. A teď to video zastavím. V dalším videu se pokusíme navázat přesně tady a pokusíme se tohle zjednodušit. -
video