Regrese
Regrese (5/10) · 9:54

Minimalizování čtvercové chyby regresní přímky (část 2) V tomto videu zjednodušíme výraz, ke kterému jsme dospěli ve videu předchozím.

Navazuje na Pravděpodobnostní rozdělení.
- Naším cílem je zjednodušit tento výraz představující součet čtvercových odchylek. Připomeňme si, co vlastně děláme. Máme těchto n bodů. A sčítáme druhé mocniny vzdáleností každého z těchto n bodů od přímky dané předpisem y = mx + b. A dostaneme tento výraz, který jsme se v minulých videích snažili zjednodušit. Zjednodušíme tento výraz, co nejvíce to půjde. A pak se pokusíme zjistit, jak to udělat, aby tento výraz byl co nejmenší. Jinak řečeno, chtěli bychom najít takové hodnoty m a b, aby byl tento výraz co nejmenší. Mohli bychom to nazvat co nejlépe padnoucí přímkou. Zdá se, že to bude čím dál komplikovanější. Ale v příštím kroku věci trošku zjednodušíme. Pokud bychom chtěli všechny čtvercové hodnoty y zprůměrovat, vyšlo by tohle. Měli bychom y1 na druhou plus y2 na druhou plus... a tak dále. Až k yn na druhou. Sečetli bychom všech n hodnot. Pak bychom je vydělili n, protože máme celkem n hodnot. Tohle je tedy průměr druhých mocnin y. Takto to můžeme označit. Pokud bychom obě strany této rovnice vynásobili n, dostali bychom y1 na druhou plus y2 na druhou a tak dále až k yn na druhou se rovná n krát průměr druhých mocnin y. Povšimněte si, že přesně totéž máme zde. Tohle je n-násobek průměru druhých mocnin y. Nebo také průměr čtvercových hodnot y. Tohle můžeme udělat s každým z těchto sčítanců. Čemu se rovná x1y1 + x2y2 + ... + xnyn? Jestliže součet všech těchto hodnot vydělíme n, dostaneme průměrnou hodnotu xy. Pro každý z těchto bodů tedy vynásobíme x krát y. Najdeme průměr všech těchto násobků. A tohle bude výsledek. Opět můžeme vynásobit obě strany rovnice n. Takto dostaneme x1y1 + x2y2 + ... + xnyn se rovná n krát průměr xy. n krát průměr xy. Myslím si, že už Vás napadlo, kam tohle směřuje. Tenhle výraz se bude rovnat n krát průměr násobků x a y. Tento výraz se rovná n krát průměr hodnot y. To představuje tenhle výraz. A tento výraz se rovná n krát průměr druhých mocnin x. Tento výraz je roven průměru x krát n. Pokud bychom jej vydělili n, dostali bychom průměr. Protože to ale neuděláme, budeme mít průměr krát n. Tímhle jsme si to moc nezjednodušili. Takže si to přepišme ještě jednou s novým značením. Víme, že tyto výrazy jsou rovny průměru y na druhou, průměru xy a tak dále. Takže čtvercová chyba, neboli součet druhých mocnin odchylek těchto n bodů od přímky se bude rovnat... tento výraz je n krát průměr druhých mocnin y. Tento výraz zde je roven mínus 2m. To máme právě zde. Krát n krát průměr hodnot xy. Jde o aritmetický průměr. A dále tu máme tento výraz. Určitě bychom ocenili, kdyby se nám jej povedlo trochu zjednodušit. Výraz zde se rovná -2bn krát průměr hodnot y. A pak zde máme m na druhou krát n krát průměr druhých mocnin x. A pak zde máme 2mb krát n krát průměr hodnot x. A konečně zde máme nb na druhou. - Takže v posledních videích jsme prostě zjednodušili výraz odpovídající součtu druhých mocnin odchylek n bodů od přímky, y = mx + b. Tímto jsme skončili s touto algebraickou fází problému. Další fází je optimalizace. Nebo lépe řečeno, chceme mimimalizovat tento výraz zde. Chceme najít takové hodnoty m a b, které výraz minimalizují. Abychom si to lépe představili, budeme se muset na chvilku zastavit u třídimenzionální matematické analýzy. Snad to nebude moc děsivé. Pokud jste někdy dělali parciální derivace, nebude to pro Vás obtížné. Tohle je plocha. Představte si, že zde máme body x a y, které považujeme za konstanty. Konstantami nejsou jen hodnoty m a b. Předpokládáme, že máme nějaké body x a y. Můžeme tedy zjistit, jaký je průměr druhých mocnin y, průměr součinu x a y, průměr y, průměr druhých mocnin x. Předpokládáme, že tato čísla známe. Takže tento výraz zde bude ve třídimenzionálním prostoru určitá plocha. Představme si, že tohle je osa m. Tohle pak osa b. Trochu je obě protáhnu. A pak si můžeme představit vertikální osu jako čtvercovou chybu. Tohle je čtvercová chyba. Takže pro libovolnou kombinaci m a b, pokud se nacházíme v soustavě souřadnic m a b... vybereme dva body m a b. Dosadíme je do tohoto výrazu pro čtvercovou chybu. Tím získáme nějaký výsledek, určitý bod. Pokud totéž uděláme pro všechny kombinace m a b, získáme plochu. - Tato plocha bude vypadat přibližně takto. Zkusím to nakreslit co nejlépe. Bude vypadat asi takto. Představte si to jako nějakou misku, nebo si to můžete představit jako třídimenzionální parabolu, pokud se Vám to tak chápe lépe. Místo obyčejné paraboly jako je tahle získáme řekněme pootočenou parabolu, která by vypadala jako hrnek nebo tak něco. A nyní se tedy snažíme najít hodnoty m a b, které odpovídají minimu. Pamatujte na to, že jsme v třírozměrném prostoru. Nevím, jestli je to takhle lepší. Představte si to zkrátka jako třírozměrný prostor, který vypadá přibližně takto. Tohle je zadní část, kterou nevidíme. Tohle je vnitřek našeho třírozměrného prostoru. Chceme najít m a b, které odpovídají na této ploše minimu. Takže existují nějaké hodnoty m a b, pro které máme na ploše minimum. V dalším videu si to zkusíme vypočítat. Abychom to mohli udělat, budeme muset najít parciální derivaci tohoto podle m. A budeme muset najít parciální derivaci tohoto podle b a obě položit rovny nule. Protože jde o minimum, je asi celkem jasné, že na ploše půjde o takový bod, kde je směrnice vzhledem k m a směrnice vzhledem k b rovna nule. V tomto bodě se tedy bude parciální derivace čtvercové chyby podle m rovnat nule. A parciální derivace čtvercové chyby vzhledem k b bude také rovna nule. Takže v dalším videu zkrátka najdeme parciální derivaci vzhledem k m a položíme ji rovnu nule. Pak najdeme parciální derivaci vzhledem k b a také ji položíme rovnu nule. A pak vyřešíme rovnice pro m a b. A najdeme tak m a b.
video