Regrese
Přihlásit se
Regrese (7/10) · 4:18

Minimalizování čtvercové chyby regresní přímky (část 4) Dokončíme postup, v němž zjišťujeme, jak nalézt "nejlepší" regresní přímku.

Navazuje na Pravděpodobnostní rozdělení.
- Už jsme se dostali vážně daleko. V několika předchozích videích jsme hledali nejlepší přímku, tedy takovou, aby součet čtverců vzdáleností všech bodů od této přímky byl co nejmenší. A teď to konečně přijde. Vyřešíme rovnici, abychom našli nejlepší m a b. A podle toho, co jsme si ukázali v předchozím videu, jsou dva způsoby, jak to udělat. Nyní už známe dva body, které leží na hledané přímce. Můžeme tedy najít směrnici přímky a její průsečík s osou y, což je parametr b. Nebo můžeme prostě vyřešit tuto soustavu rovnic. Oba způsoby jsou z matematického hlediska rovnocenné. Najdeme nejdříve m. Pokud chceme najít m. potřebujeme dostat pryč b. Takže přepíšu tuto horní rovnici stejně jako je napsána tady. Bude to: m krát (průměr x na druhou) plus b krát... Vlastně.... vlastně by to šlo ještě lépe. Využijeme to, co jsme dělail v minulých videích. A vidíme, že můžeme odečíst spodní rovnici od té horní. Takže to odečtěme. Neboli přičtěme záporné hodnoty. Takže toto bude záporné, toho bude také záporné... Co dostaneme? Dostaneme m krát (průměr x) mínus (průměr x na druhou) lomeno průměr x. ... Tato b se odečtou. Takže se to rovná průměr y mínus průměr xy lomeno průměr x. A pak můžeme vydělit obě strany rovnice tímto výrazem. A dostaneme: m se rovná průměr y mínus průměr xy lomeno průměr x lomeno všechno toto v závorce. Tedy v jmenovateli bude průměr x mínus průměr x na druhou lomeno průměr x. Všimněme si, tohle je totéž, co bychom dostali, kdybychom hledali směrnici pomocí těchto dvou bodů. Byl by to podíl změny y, kde změna y je rozdíl mezi touto ypsilonovou souřadnicí a touto, To je přesně totéž, co máme tady dole. Děleno změna x. Kde změna x je rozdíl mezi touto souřadnicí x a touto. Opět přesně totéž, co máme tady. Abychom to zjednodušili, vynásobíme čitatel i jmenovateli průměrem x. Dělám to jen proto, abychom neměli tento jmenovatel na obou místech. Takže pokud vynásobíme čitatel průměrem x, dostaneme tento výraz: průměr x krát průměr y mínus... tohle se vykrátí. A zbude mínus průměr xy. ... A ve jmenovateli bude průměr x krát průměr x, což bude tedy (průměr x) na druhou. Mínus průměr (x na druhou). Takhle spočítáme m. A pokud chceme spočítat b, můžeme zkrátka dosadit tento výraz do kterékoli rovnice. Ale tahle se zdá jednodušší. Pokud chceme spočítat b, můžeme vyjádřit b pomocí m. Odečteme tedy (m krát průměr x) na obou stranách rovnice. A dostaneme: b se rovná průměr y mínus m krát průměr x. Takže stačí vzít si nějaký bod, najít průměr x, průměr y, průměr xy a průměr (x na druhou), a spočítat m Jakmile máme m, můžeme dostadit zpět do této rovnice a najít b. A tak zjistíme parametry nejlepší přímky. A máme hotovo. Takže toto jsou dva nejdůležitější vzorce pro hledání parametrů nejlepší přímky. A co budeme dělat v dalším videu? Pokud někdo pár videí přeskočil, další video už přeskakovat nedoporučuji, protože v něm skutečně použijeme tyto vzorce k nalezení nejlepší přímky. Tedy za předpokladu, že minimalizujeme součet čtverců vzdáleností bodů od této přímky, Použijeme tyto vzorce, abychom našli nejlepší přímku vzhledem k zadaným datům. -
video