間違いしかありません.コメントにてご指摘いただければ幸いです(気が付いた点を特に断りなく頻繁に書き直していますのでご注意ください).

線形単回帰の回帰直線 / 最小二乗推定量(least squares estimate; LSE)

線形単回帰の回帰直線

Xを説明変数(独立変数),Yを目的変数(従属変数)とし,線形単回帰として以下のよう関係を考える.この時,同式が直線を表すことから回帰直線と呼ぶ. Y=α+βX 線形単回帰としてデータを捉えるのでデータも次の構造式で考える. yi=α+βxi+ϵiϵiiidN(0,σ2) 回帰直線で推定されるX=xiに対応するYの値をy^iとする.またy^iを求めるためのパラメタα,βの推定値としてα^,β^とすると以下のような式となる. yi^=α^+β^xi
平均や平方和. x¯=1ni=1nxiy¯=1ni=1nyiSxx=i=1n(xix¯)2=i=1n(xi22xix¯+x¯2)=(i=1nxi2)2(i=1nxi)x¯+x¯2(i=1n1)=(i=1nxi2)2nx¯2+nx¯2i=1nxi=nx¯=(i=1nxi2)nx¯2Syy=i=1n(yiy¯)2=i=1n(yi22yiy¯+y¯2)=(i=1nyi2)2(i=1nyi)y¯+y¯2(i=1n1)=(i=1nyi2)2ny¯2+ny¯2i=1nyi=ny¯=(i=1nyi2)ny¯2Sxy=i=1n(xix¯)(yiy¯)=i=1n(xiyixiy¯x¯yi+x¯y¯)=(i=1nxiyi)(i=1nxi)y¯x¯(i=1nyi)+x¯y¯(i=1n1)=(i=1nxiyi)nx¯y¯nx¯y¯+nx¯y¯i=1nxi=nx¯,i=1nyi=ny¯=(i=1nxiyi)nx¯y¯ 残差平方和Seを展開する. Se=i=1nei2=i=1n(yiyi^)2ei=yiyi^=i=1n{yi(α^+β^xi)}2yi^=α^+β^xi=i=1n{yi22yi(α^+β^xi)+(α^+β^xi)2}(ab)2=a22ab+b2=i=1n(yi22yiα^2xiyiβ^+α^2+2xiα^β^+xi2β^2)=(i=1nyi2)2(i=1nyi)α^2(i=1nxiyi)β^+(i=1n1)α^2+2(i=1nxi)α^β^+(i=1nxi2)β^2i=0n(ai+bi)=i=0nai+i=0nbi=(i=1nyi2)2ny¯α^2(i=1nxiyi)β^+nα^2+2nx¯α^β^+(i=1nxi2)β^2i=1nxi=nx¯,i=1nyi=ny¯,i=1n1=n 極値となるα^,β^を求めるためSeα,βでの偏微分を求める. Seα^=2ny¯+2nα^+2nx¯β^=2n(α^+x¯β^y¯)Seβ^=2(i=1nxiyi)+2nx¯α^+2(i=1nxi2)β^=2{(i=1nxiyi)+nx¯α^+(i=1nxi2)β^} 二階の偏微分はそれぞれ常に正の数なので極小となる. 2Seα^2=2n>02Seβ^2=2(i=1nxi2)>0 一階の偏微分を連立させるSeα^=0,Seβ^=0. これによりα,βの推定値α^,β^を求める. {2n(α^+x¯β^y¯)=02{(i=1nxiyi)+nx¯α^+(i=1nxi2)β^}=0 {α^+x¯β^y¯=0nx¯α^+(i=1nxi2)β^(i=1nxiyi)=0 上記を正規方程式(normal equation)という.
一つ目の式をα^について解く. α^+x¯β^y¯=0α^=y¯x¯β^ 二つ目の式のα^にこれを代入する. nx¯α^+(i=1nxi2)β^(i=1nxiyi)=0nx¯(y¯x¯β^)+(i=1nxi2)β^(i=1nxiyi)=0nx¯y¯nx¯2β^+(i=1nxi2)β^(i=1nxiyi)=0nx¯y¯+{(i=1nxi2)nx¯2}β^(i=1nxiyi)=0{(i=1nxi2)nx¯2}β^=(i=1nxiyi)nx¯y¯β^=(i=1nxiyi)nx¯y¯(i=1nxi2)nx¯2=SxySxx よって回帰直線の係数α^,β^は以下のようになる. α^=y¯βx¯=y¯SxySxxx¯β^=SxySxx 残差の二乗を最小とするように求めたこのα^,β^最小二乗推定量(least squares estimate; LSE)と呼ぶ.
β^の分母はSxx=i=0n(xix¯)2であり,0または正の値である(0は全てのxix¯と等しいとき). よって回帰直線の傾きはSxyによるものである.
またα^,β^を求める際に用いた正規方程式にあるように,この直線が(x¯,y¯)を通ることがわかる. α^+x¯β^y¯=01y¯=α^+x¯β^

0 件のコメント:

コメントを投稿