間違いしかありません.コメントにてご指摘いただければ幸いです(気が付いた点を特に断りなく頻繁に書き直していますのでご注意ください).

独立なガウス分布に従う誤差を含む回帰モデルがn個の同時確率を考える

独立なガウス分布N(μi,σi2)に従う誤差ϵiを含む回帰モデルyi=βxi+α+ϵin個の同時確率を考える

準備

x¯=1ni=1nxiy¯=1ni=1nyii=1n(xix¯)(yiy¯)=i=1n(xiyixiy¯x¯yi+x¯y¯)=i=1nxiyiy¯i=1nxix¯i=1nyi+x¯y¯i=1n1=i=1nxiyiy¯nx¯x¯ny¯+x¯y¯n=i=1nxiyi2nx¯y¯+nx¯y¯=i=1nxiyinx¯y¯Sxyi=1n(xix¯)2=i=1n(xi22xix¯+x¯2)=i=1nxi22x¯i=1nxi+x¯2i=1n1=i=1nxi22x¯nx¯+x¯2n=i=1nxi22nx¯2+nx¯2=i=1nxi2nx¯2Sxx

同時確率を考える

p(ϵ1,ϵ2,,ϵn)=12πσ12e(ϵ1μ1)22σ12×12πσ22e(ϵ2μ2)22σ22××12πσn2e(ϵnμn)22σn2=(i=1n12πσi2)(i=1ne(ϵiμi)22σi2)=(i=1n(2πσi2)12)(i=1ne(yiβxiαμi)22σi2)yi=βxi+α+ϵi,ϵi=yiβxiα

負の対数によって情報量を求める

ln(p)=ln((i=1n(2πσi2)12)(i=1ne12σi2(yiβxiαμi)2))=ln(i=1n(2πσi2)12)ln(i=1ne12σi2(yiβxiαμi)2)=i=1nln((2πσi2)12)i=1nln(e12σi2(yiβxiαμi)2)=i=1n{12ln(2πσi2)}i=1n(12σi2(yiβxiαμi)2)=i=1n{12ln(2πσi2)}+i=1n12σi2(yiβxiαμi)2=i=1n{12ln(2πσi2)}+i=1n12σi2(yi2+β2xi2+α2+μi22βxiyi2αyi2yiμi+2αβxi+2βxiμi+2αμi)

回帰モデルの係数で微分する

βについて. β(ln(p))=0+i=1n12σi2(0+2βxi2+0+02xiyi00+2αxi+2xiμi+0)=i=1n1σi2(βxi2xiyi+αxi+xiμi)=βi=1nxi2σi2i=1nxi(yiαμi)σi2 αについて. α(ln(p))=0+i=1n12σi2(0+0+2α+002yi0+2βxi+0+2μi)=i=1n1σi2(αyi+βxi+μi)=αi=1n1σi2i=1nyiβxiμiσi2

微分が0となるα^,β^,つまり極値となるパラメータを求める

β^について. 0=β(ln(p))=β^i=1nxi2σi2i=1nxi(yiα^μi)σi2β^i=1nxi2σi2=i=1nxi(yiα^μi)σi2β^=i=1nxi(yiα^μi)σi2i=1nxi2σi2 α^について. 0=α(ln(p))=α^i=1n1σi2i=1nyiβ^xiμiσi2α^i=1n1σi2=i=1nyiβ^xiμiσi2α^=i=1nyiβ^xiμiσi2i=1n1σi2

誤差の発生が全て同一モデルϵiN(0,σ2)から発生しているとする

α^について. α^=1σ2i=1n(yiβ^xi0)nσ2ϵiN(0,σ2)=1ni=1n(yiβ^xi)=i=1nyinβ^i=1nxin=y¯β^x¯ β^について. β^=1σ2i=1nxi(yiα^0)1σ2i=1nxi2ϵiN(0,σ2)=i=1nxiyiα^i=1nxii=1nxi2=i=1nxiyiα^nx¯i=1nxi2=i=1nxiyi(y¯β^x¯)nx¯i=1nxi2α^=y¯β^x¯,α^=i=1nxiyinx¯y¯+β^nx¯2i=1nxi2β^β^nx¯2i=1nxi2=i=1nxiyinx¯y¯i=1nxi2β^(i=1nxi2nx¯2i=1nxi2)=i=1nxiyinx¯y¯i=1nxi2β^=i=1nxiyinx¯y¯i=1nxi2nx¯2=i=1n(xix¯)(yiy¯)i=1n(xix¯)2

まとめ

{β^=i=1nxiyinx¯y¯i=1nxi2nx¯2=i=1n(xix¯)(yiy¯)i=1n(xix¯)2α^=y¯β^x¯

0 件のコメント:

コメントを投稿