Vícenásobné regrese mohou být okouzlující, pokušení injekční analýzy. Je to tak snadné přidat více proměnných, jak si myslíte o nich, nebo jen proto, že data jsou po ruce. Některé z prediktorů budou významné. Možná existuje vztah, nebo je to jen náhodou? Můžete přidat vyššího řádu polynomů ohýbat a kroutit, že vybavená linka, jak se vám líbí, ale jste montáž skutečné vzory, nebo jen připojením tečky?, Po celou dobu se hodnota R-squared (R2) zvyšuje, škádlí vás a vybízí k přidání dalších proměnných!
dříve jsem ukázal, jak R-squared může být zavádějící, když hodnotíte dobrotu vhodné pro lineární regresní analýzu. V tomto příspěvku, budeme se podívat na důvod, proč byste měli odolat nutkání přidat příliš mnoho prediktorů, aby regresní model, a jak upravené R-kvadrát a předpověděl R-squared může pomoci!,
některé problémy s R-na druhou
ve svém posledním příspěvku jsem ukázal, jak R-na druhou nemůže určit, zda jsou odhady koeficientu a předpovědi zkreslené, a proto musíte posoudit zbytkové grafy. R-squared má však další problémy, které jsou navrženy tak, aby řešily upravené r-na druhou a předpovídané r-na druhou.
Problém 1: pokaždé, když přidáte prediktor k modelu, R-na druhou se zvyšuje, i když kvůli náhodě sám. Nikdy neklesá. V důsledku toho se může zdát, že model s více podmínkami má lepší kondici jednoduše proto, že má více podmínek.,
Problém 2: pokud má model příliš mnoho prediktorů a polynomů vyššího řádu, začne modelovat náhodný šum v datech. Tato podmínka je známá jako overfitting modelu a vytváří zavádějící vysoké hodnoty R na druhou a sníženou schopnost předpovídat.
jaký je upravený R-na druhou?
upravený R-čtverec porovnává vysvětlující sílu regresních modelů, které obsahují různé počty prediktorů.
Předpokládejme, že porovnáte pětipřediktorový model s vyšším R-na druhou s jednopřediktorovým modelem., Má model pěti prediktorů vyšší r-na druhou, protože je lepší? Nebo je R-na druhou vyšší, protože má více prediktorů? Jednoduše porovnejte nastavené hodnoty R-squared a zjistěte to!
upravený R-na druhou je upravená verze R-na druhou, která byla upravena pro počet prediktorů v modelu. Upravený R-squared se zvyšuje pouze v případě, že nový termín vylepšuje model více, než by se očekávalo náhodou. Snižuje se, když prediktor vylepšuje model o méně, než se očekávalo náhodou. Upravený R-čtverec může být negativní, ale obvykle to není., Je vždy nižší než R-na druhou.
ve zjednodušené nejlepší podmnožiny regresní výstup níže, můžete vidět, kde upravené R-čtvercové vrcholy, a pak klesá. Mezitím R-na druhou stále roste.
do tohoto modelu můžete zahrnout pouze tři prediktory. V mém posledním blogu jsme viděli, jak nedostatečně specifikovaný model (ten, který byl příliš jednoduchý) může produkovat zkreslené odhady. Nicméně, overspecified model (ten, který je příliš složitý) je více pravděpodobné, že ke snížení přesnosti odhadů koeficientů a předpokládaných hodnot., V důsledku toho nechcete do modelu zahrnout více termínů, než je nutné. (Přečtěte si příklad použití Minitab je nejlepší podmnožiny regrese.)
konečně, jiné použití pro upravené r-na druhou je, že poskytuje objektivní odhad populace R-na druhou.
jaký je předpokládaný r-na druhou?
předpokládaný r-na druhou ukazuje, jak dobře regresní model předpovídá odpovědi na nová pozorování. Tato statistika vám pomůže určit, kdy model odpovídá původním datům, ale je méně schopen poskytnout platné předpovědi pro nová pozorování., (Přečtěte si příklad použití regrese k předpovědi.)
Minitab vypočítá předpokládané spolehlivosti R o systematické odstraňování jednotlivých pozorování ze souboru dat, odhad regresní rovnice, a určení, jak dobře model předpovídá odstraněny pozorování. Stejně jako nastavený R-na druhou, předpovídaný R-na druhou může být negativní a je vždy nižší než R-na druhou.
i když nemáte v plánu použít model pro předpovědi, předpovídaný R-squared stále poskytuje klíčové informace.
klíčovou výhodou předpovídaného r-na druhou je to, že vám může zabránit v přepočítání modelu., Jak již bylo zmíněno dříve, model overfit obsahuje příliš mnoho prediktorů a začíná modelovat náhodný šum.
protože není možné předvídat náhodný šum, musí předpovězený R-čtverec klesnout pro model overfit. Pokud vidíte předpovídaný R-čtverec, který je mnohem nižší než normální r-na druhou, téměř jistě máte v modelu příliš mnoho termínů.
příklady modelů Overfit a předpovídaných R-squared
tyto příklady si můžete vyzkoušet sami pomocí tohoto souboru projektu Minitab, který obsahuje dva listy., Pokud chcete hrát spolu a nemáte ji již, stáhněte si zdarma 30denní zkušební verzi statistického softwaru Minitab!
existuje snadný způsob, jak vidět model overfit v akci. Pokud analyzujete lineární regresní model, který má jeden prediktor pro každý stupeň svobody, vždy získáte R-na druhou 100%!
v listu náhodných dat jsem vytvořil 10 řádků náhodných dat pro proměnnou odezvy a devět prediktorů. Protože existuje devět prediktorů a devět stupňů volnosti, dostaneme r-na druhou 100%.,
zdá se, že model představuje všechny varianty. Víme však, že náhodné prediktory nemají žádný vztah k náhodné odpovědi! Přizpůsobujeme se jen náhodné variabilitě.
to je extrémní případ, ale podívejme se na některá skutečná data v prezidentově žebříčku.
tyto údaje pocházejí z mého příspěvku o velkých prezidentech. Nenašel jsem žádnou souvislost mezi nejvyšším hodnocením každého prezidenta a hodnocením historika. Ve skutečnosti jsem popsal, že osazené linie plot (níže) jako příklad žádný vztah, plochá čára s R-na druhou 0,7%!,
Řekněme, že jsme nevěděli lépe a překonali jsme model tím, že jsme zahrnuli nejvyšší hodnocení schválení jako krychlový polynom.
Wow, jak R-na druhou, tak upravené r-na druhou vypadají docela dobře! Odhady koeficientů jsou také významné, protože jejich hodnoty p jsou menší než 0,05. Zbytkové pozemky (nejsou zobrazeny) vypadají také dobře. Skvělé!
ne tak rychle…vše, co děláme, je příliš ohýbání vybavená linka uměle pospojovat, spíše než najít skutečný vztah mezi proměnnými.,
náš model je příliš komplikovaný a předpovídaný R-squared to rozdává. Ve skutečnosti máme zápornou předpokládanou hodnotu R-na druhou. To se nemusí zdát intuitivní, ale pokud je 0% hrozné, negativní procento je ještě horší!
předpokládaný r-na druhou nemusí být negativní pro označení modelu overfit. Pokud vidíte, že předpovídaný R-squared začne klesat, když přidáte prediktory, i když jsou významné, měli byste se začít obávat přehodnocení modelu.,
Zavírání Myšlenky o Adjusted R-squared a Předpověděl R na druhou
Všechny údaje obsahují přírodní množství variability, které je nevysvětlitelné. Bohužel, R-squared nerespektuje tento přirozený strop. Honba za vysokou hodnotou R na druhou nás může přimět, abychom zahrnuli příliš mnoho prediktorů ve snaze vysvětlit nevysvětlitelné.
v těchto případech můžete dosáhnout vyšší hodnoty R na druhou, ale za cenu zavádějících výsledků, snížené přesnosti a snížené schopnosti předpovídat.,
Oba upravené R-kvadrát a předpověděl R-square poskytnout informace, které vám pomůže zhodnotit počet prediktorů v modelu:
- Používat upravené R-kvadrát pro porovnání modelů s různým počtem prediktorů
- Použití předpokládané R-square zjistit, jak dobře model předpovídá nové poznatky a zda model je příliš komplikované
Regresní analýzy je silný, ale nechceš se svést, že moc a použít ji nerozumně!
Pokud se učíte o regresi, přečtěte si můj regresní tutoriál!