間違いしかありません.コメントにてご指摘いただければ幸いです(気が付いた点を特に断りなく頻繁に書き直していますのでご注意ください).

単回帰モデルの最小二乗推定量の分布

単回帰モデルの最小二乗推定量α^,β^の分布

単回帰モデル

yi=α+βxi+ϵi(i=1,,n)ϵiiidN(0,σ2)E[yi]=E[α+βxi+ϵi]=α+βxi+E[ϵi]E[X+t]=E[X]+t=α+βxi+0ϵiiidN(0,σ2)=α+βxiV[yi]=V[α+βxi+ϵi]=V[ϵi]V[X+t]=V[X]=σ2ϵiiidN(0,σ2)yiN(α+βxi,σ2) yiN(α+βxi,σ2)に従う確率変数である.

β^i=1nciyiの形で表す

推定量がi=1ncixi(xi:,ci:)の形で表現できるとき,この推定量を線形推定量(linear estimate)という.
(よく知られる線形推定量の例として平均x¯があり,x¯=i=1n1nxiで表現される) β^=SxySxxβ^=SxySxx,Sxx=i=1n(xix¯)2,x¯=1ni=1nxi=1Sxxi=1n(xix¯)(yiy¯)=1Sxxi=1n(xix¯)yii=1n(xix¯)(yiy¯)=Sxy=i=1n(xix¯)yi=i=1nxix¯Sxxyi=i=1nciyici=xix¯Sxx

β^の期待値をi=1nciyiから求めてみる

E[i=1nciyi]=E[i=1nxix¯Sxxyi]=E[SxySxx],SxySxx=i=1nxix¯Sxxyi=E[β^]β^=SxySxx=βE[β^]=β

β^の分散をi=1nciyiから求めてみる

V[i=1nciyi]=V[i=1nxix¯Sxxyi]=i=1nV[xix¯Sxxyi]yiCov[yi,yj]=0,V[X+Y]=V[X]+V[Y]=i=1n(xix¯Sxx)2V[yi]V[cX]=c2V[X]=i=1n(xix¯Sxx)2σ2=σ2Sxx2i=1n(xix¯)2=σ2Sxx2SxxSxx=i=1n(xix¯)2=σ2SxxV[SxySxx]=σ2Sxx

β^の分布

以上のように,β^は線形推定量であり,正規分布に従うyiの定数倍の和で表すことができた.よってβ^は同様に正規分布に従い,その期待値と分散はそれぞれ上記で求めたとおりである Z=c1X+c2Y(XN(μ1,σ12),YN(μ2,σ22),ZN(c1μ1+c2μ2,c12σ12+c22σ22))β^N(β,σ2Sxx)

α^i=1nciyiの形で表す

α^=y¯β^x¯α^=y¯β^x¯=i=1n1nyiSxySxxx¯=i=1n1nyi(i=1nxix¯Sxxyi)x¯,SxySxx=i=1nxix¯Sxxyi=i=1n1nyix¯i=1nxix¯Sxxyi=i=1n1nyii=1nx¯(xix¯)Sxxyi=i=1n(1nx¯(xix¯)Sxx)yi=i=1nciyici=1nx¯(xix¯)Sxx

α^の期待値をi=1nciyiから求めてみる

E[i=1nciyi]=E[i=1n(1nx¯(xix¯)Sxx)yi]=E[i=1n(1nyix¯(xix¯)Sxxyi)]=E[i=1n1nyii=1nx¯(xix¯)Sxxyi]=E[i=1n1nyii=1nx¯(xix¯)Sxxyi]=E[i=1n1nyi]E[i=1nx¯(xix¯)Sxxyi]E[X+Y]=E[X]+E[Y]=E[1ni=1nyi]E[x¯i=1n(xix¯)Sxxyi]=1nE[i=1nyi]x¯E[i=1n(xix¯)Sxxyi]E[cX]=cE[X]=1ni=1nE[yi]x¯E[SxySxx],SxySxx=i=1nxix¯Sxxyi=1ni=1n(α+βxi)x¯E[SxySxx]E[yi]=α+βxi=1n(αi=1n1+βi=1nxi)x¯E[β^]β^=SxySxx=1n(nα+βnx¯)x¯βE[β^]=β=1nn(α+βx¯)x¯β=(α+βx¯)x¯β=αE[α^]=α

α^の分散をi=1nciyiから求めてみる

V[i=1nciyi]=V[i=1n(1nx¯(xix¯)Sxx)yi]=i=1nV[(1nx¯(xix¯)Sxx)yi]V[SxySxx]=σ2Sxx=i=1n(1nx¯(xix¯)Sxx)2V[yi]V[cX]=c2V[X]=i=1n(1nx¯(xix¯)Sxx)2σ2=σ2i=1n(1nx¯(xix¯)Sxx)2=σ2i=1n(1n221nx¯(xix¯)Sxx+(x¯(xix¯)Sxx)2)=σ2(i=1n1n2i=1n21nx¯(xix¯)Sxx+i=1n(x¯(xix¯)Sxx)2)=σ2(1n2i=1n12x¯nSxxi=1n(xix¯)+x¯2Sxx2i=1n(xix¯)2)=σ2(1n2n2x¯nSxx0+x¯2Sxx2Sxx)=σ2(1n2n2x¯nSxx0+x¯2Sxx2Sxx)=σ2(1n+x¯2Sxx)V[y¯β^x¯]=(1n+x¯2Sxx)σ2

α^の分布

以上のように,α^は線形推定量であり,正規分布に従うyiの定数倍の和で表すことができた.よってα^は同様に正規分布に従い,その期待値と分散はそれぞれ上記で求めたとおりである Z=c1X+c2Y(XN(μ1,σ12),YN(μ2,σ22),ZN(c1μ1+c2μ2,c12σ12+c22σ22))α^N(α,σ2(1n+x¯2Sxx))

確率変数の変数変換 Z=c1X+c2Y / 正規分布の定数倍同士の和

確率変数の変数変換 Z=c1X+c2Y / 正規分布の定数倍同士の和

確率変数の変数変換 Z=c1X+c2Y

pc1X+c2Y(z)=δ(z(c1x+c2y))fX(x)gY(y)dxdyδ(x)f(x)dx=f(0)X=x,Y=yf(x)g(x)z(c1x+c2y)=0.=δ(z(c1x+c2y))fX(x)gY(y)dxdyδ(u(x))=αu1(0)1|u(α)|δ(xα)u(x)=z(c1x+c2y)u(x=α)=0,α=zc2yc1u=dudx=ddx(z(c1x+c2y))=c1δ(z(c1x+c2y))=1|u(α)|δ(xα)=1|c1|δ(xzc2yc1)=1|c1|δ(xzc2yc1)=1|c1|δ(xzc2yc1)fX(x)gY(y)dy=1|c1|δ(zc2yc1zc2yc1)fX(zc2yc1)gY(y)dyz=c1x+c2y,x=zc2yc1=1|c1|δ(0)fX(zc2yc1)gY(y)dycf(x)dx=cf(x)dx=1|c1|fX(zc2yc1)gY(y)dy

正規分布の定数倍同士の和の例

fX(x)=12πσ12e(xμ1)22σ12N(μ1,σ12)()gY(y)=12πσ22e(yμ2)22σ22N(μ2,σ22)()pc1X+c2Y(z)=1|c1|fX(zc2yc1)gY(y)dy=1|c1|12πσ12e{(zc2yc1)μ1}22σ1212πσ22e(yμ2)22σ22dy=1|c1|12πσ1212πσ22e{(zc2yc1)μ1}22σ12+(yμ2)22σ22dycf(x)dx=cf(x)dx=1|c1|12πσ12σ22e{(zc2yc1)μ1}22σ12+(yμ2)22σ22dy=1|c1|12πσ12σ22ef1(c1,c2,y,z,μ1,μ2,σ1,σ2)dyf1y
f1(c1,c2,y,z,μ1,μ2,σ1,σ2)={(zc2yc1)μ1}22σ12+(yμ2)22σ22=12{(1c1zc2c1yμ1)2σ12+(yμ2)2σ22}=12{σ22(1c1zc2c1yμ1)2+σ12(yμ2)2σ12σ22}=12σ12σ22{σ22(1c1zc2c1yμ1)2+σ12(yμ2)2}=12σ12σ22[σ22{(1c1z)22(1c1z)(c2c1y)2(1c1z)μ1+(c2c1y)2+2(c2c1y)μ1+μ12}+σ12(y22yμ2+μ22)]=12σ12σ22{1c12σ22z22c2c12σ22zy21c1σ22zμ1+c22c12σ22y2+2c2c1σ22yμ1+σ22μ12+σ12y22σ12yμ2+σ12μ22}=12σ12σ221c12{σ22z22c2σ22zy2c1σ22zμ1+c22σ22y2+2c1c2σ22yμ1+c12σ22μ12+c12σ12y22c12σ12yμ2+c12σ12μ22}=12c12σ12σ22{(c12σ12+c22σ22)y2+(2c2σ22z+2c1c2σ22μ12c12σ12μ2)y+σ22z22c1σ22zμ1+c12σ22μ12+c12σ12μ22}=12c12σ12σ22{(c12σ12+c22σ22)y22(c2σ22zc1c2σ22μ1+c12σ12μ2)y+σ22z22c1σ22zμ1+c12σ22μ12+c12σ12μ22}=12c12σ12σ22{(c12σ12+c22σ22)(y22c2σ22zc1c2σ22μ1+c12σ12μ2c12σ12+c22σ22y)+σ22z22c1σ22zμ1+c12σ22μ12+c12σ12μ22}==12c12σ12σ22{(c12σ12+c22σ22)(y22c2σ22zc1c2σ22μ1+c12σ12μ2c12σ12+c22σ22y)+AA+σ22z22c1σ22zμ1+c12σ22μ12+c12σ12μ22}A=12c12σ12σ22{(c12σ12+c22σ22)(y22c2σ22zc1c2σ22μ1+c12σ12μ2c12σ12+c22σ22y+1c12σ12+c22σ22A)A+σ22z22c1σ22zμ1+c12σ22μ12+c12σ12μ22}=12c12σ12σ22[(c12σ12+c22σ22){y22c2σ22zc1c2σ22μ1+c12σ12μ2c12σ12+c22σ22y+1c12σ12+c22σ22(c2σ22zc1c2σ22μ1+c12σ12μ2)2c12σ12+c22σ22}(c2σ22zc1c2σ22μ1+c12σ12μ2)2c12σ12+c22σ22+σ22z22c1σ22zμ1+c12σ22μ12+c12σ12μ22]A=(c2σ22zc1c2σ22μ1+c12σ12μ2)2c12σ12+c22σ22=12c12σ12σ22{(c12σ12+c22σ22)(y2c2σ22zc1c2σ22μ1+c12σ12μ2c12σ12+c22σ22)2(c2σ22zc1c2σ22μ1+c12σ12μ2)2c12σ12+c22σ22+σ22z22c1σ22zμ1+c12σ22μ12+c12σ12μ22}=(c12σ12+c22σ22)2c12σ12σ22(y2c2σ22zc1c2σ22μ1+c12σ12μ2c12σ12+c22σ22)212c12σ12σ22{(c2σ22zc1c2σ22μ1+c12σ12μ2)2c12σ12+c22σ22+σ22z22c1σ22zμ1+c12σ22μ12+c12σ12μ22}=f2(c1,c2,σ12,σ22){yf3(c1,c2,z,μ1,μ2,σ12,σ22)}2f4(c1,c2,z,μ1,μ2,σ12,σ22)f2,f3,f4y.=f2(yf3)2f4y.f2(c1,c2,σ12,σ22)=(c12σ12+c22σ22)2c12σ12σ22f3(c1,c2,z,μ1,μ2,σ12,σ22)=c2σ22zc1c2σ22μ1+c12σ12μ2c12σ12+c22σ22f4(c1,c2,z,μ1,μ2,σ12,σ22)=12c12σ12σ22{(c2σ22zc1c2σ22μ1+c12σ12μ2)2c12σ12+c22σ22+σ22z22c1σ22zμ1+c12σ22μ12+c12σ12μ22}=12c12σ12σ22{(c2σ22(zc1μ1)+c12σ12μ2)2+(c12σ12+c22σ22)(σ22(zc1μ1)2+c12σ12μ22)c12σ12+c22σ22}=12c12σ12σ22(c2σ22B+c12σ12μ2)2+(c12σ12+c22σ22)(σ22B2+c12σ12μ22)c12σ12+c22σ22B=zc1μ1=12c12σ12σ22(c12σ12+c22σ22){(c2σ22B+c12σ12μ2)2+(c12σ12+c22σ22)(σ22B2+c12σ12μ22)}=12c12σ12σ22(c12σ12+c22σ22)(c22σ24B22c12c2σ12σ22μ2Bc14σ14μ22+c12σ12σ22B2+c22σ24B2+c14σ14μ22+c12c22σ12σ22μ22)=12c12σ12σ22(c12σ12+c22σ22)c12σ12σ22{2c2μ2B+B2+c22μ22}=12(c12σ12+c22σ22)(Bc2μ2)2=(zc1μ1c2μ2)22(c12σ12+c22σ22)B=zc1μ1=(z(c1μ1+c2μ2))22(c12σ12+c22σ22)
pc1X+c2Y(z)=1|c1|12πσ12σ22ef1(c1,c2,y,z,μ1,μ2,σ1,σ2)dy=1|c1|12πσ12σ22ef2(yf3)2f4dy=1|c1|12πσ12σ22ef2(yf3)2ef4dy=1|c1|12πσ12σ22ef4ef2(yf3)2dy=1|c1|12πσ12σ22ef4eu21f2duu=f2(yf3),dudy=f2,dy=1f2duy:,u:=1|c1|12πσ12σ22ef41f2eu2ducf(x)dx=cf(x)dx=1|c1|12πσ12σ22ef41f2πeu2du=π=1|c1|12πσ12σ22ef4πf2=1|c1|12πσ12σ22πf2ef4=1|c1|12πσ12σ22π(c12σ12+c22σ22)2c12σ12σ22e(z(c1μ1+c2μ2))22(c12σ12+c22σ22)=1|c1|12πσ12σ222πc12σ12σ22(c12σ12+c22σ22)e(z(c1μ1+c2μ2))22(c12σ12+c22σ22)=1|c1|c122π(c12σ12+c22σ22)e(z(c1μ1+c2μ2))22(c12σ12+c22σ22)=1|c1||c1|2π(c12σ12+c22σ22)e(z(c1μ1+c2μ2))22(c12σ12+c22σ22)A2={A(A0)A(A<0)=|A|=12π(c12σ12+c22σ22)e(z(c1μ1+c2μ2))22(c12σ12+c22σ22)N(c1μ1+c2μ2,c12σ12+c22σ22)

確率変数の変数変換 Z=X+Y その2 / 正規分布の再生性

確率変数の変数変換 Z=X+Y その2 / 正規分布の再生性

Z=X+Y 正規分布同士の例

fX(x)=12πσ12e(xμ1)22σ12N(μ1,σ12)()gY(x)=12πσ22e(yμ2)22σ22N(μ2,σ22)()pX+Y(z)=δ(z(x+y))fX(x)gY(y)dxdy=δ(z((zy)+y))fX(zy)gY(y)dyz=x+y,x=zy=δ(0)fX(zy)gY(y)dy=fX(zy)gY(y)dy=12πσ12e(zyμ1)22σ1212πσ22e(yμ2)22σ22dy=12πσ1212πσ22e(zyμ1)22σ12+(yμ2)22σ22dy=12πσ12σ22e(zyμ1)22σ12+(yμ2)22σ22dy=12πσ12σ22ef1(y,z,μ1,μ2,σ1,σ2)dyf1y
Math input error
pX+Y(z)=12πσ12σ22ef1(y,z,μ1,μ2,σ1,σ2)dy=12πσ12σ22ef2(yf3)2f4dy=12πσ12σ22ef2(yf3)2ef4dyAB+C=ABAC=12πσ12σ22ef4ef2(yf3)2dycf(x)dx=cf(x)dx=12πσ12σ22ef4ef2(yf3)2dy=12πσ12σ22ef4eu2(1f2)duu=f2(yf3),dudy=f2,dy=1f2du,y:,u:=12πσ12σ22ef41f2eu2du=12πσ12σ221f2ef4πeu2du=π=12πσ12σ221σ12+σ222σ12σ22e{z(μ1+μ2)}22(σ12+σ22)π=12πσ12σ222πσ12σ22σ12+σ22e{z(μ1+μ2)}22(σ12+σ22)=12π(σ12+σ22)e{z(μ1+μ2)}22(σ12+σ22)N(μ1+μ2,σ12+σ22)() 再生性は,同じ確率分布族に含まれる確率分布F1,F2に対して X1F1,X2F2とする互いに独立な確率変数に対して, X1+X2がやはり同一の確率分布族に含まれる性質.

単回帰モデルの最尤推定量の期待値,分散,分布

単回帰モデルの最尤推定量の期待値,分散,分布

単回帰モデル

yi=α+βxi+ϵi(i=1,,n)ϵiiidN(0,σ2)(independentandidenticallydistributed;IID,i.i.d.,iid) α,β,σ2の推定量をα^,β^,σ^2とし,α^,β^,σ^2の最尤推定量(maximum likelihood estimator)をα^ML,β^ML,σ^ML2とする.

β^MLの期待値

E[β^ML]=E[β^]β^ML=β^=βE[β^]=ββ^ML2β2.

α^MLの期待値

E[α^ML]=E[α^]α^ML=α^=αE[α^]=αα^ML2α2.

β^MLの分散

V[β^ML]=V[β^]=1Sxxσ2V[β^]=1Sxxσ2x¯=1ni=0nxi,Sxx=i=0n(xix¯)2

α^MLの分散

V[α^ML]=V[α^]=(1n+x¯2Sxx)σ2V[α^]=(1n+x¯2Sxx)σ2

α^ML,β^MLの分布

β^ML=β^N(β,1Sxxσ2)β^N(β,1Sxxσ2)α^ML=α^N(α,(1n+x¯2Sxx)σ2)α^N(α,(1n+x¯2Sxx)σ2)

σ^ML2の期待値

E[σ^ML2]=E[n2ns2]σ^ML2=n2ns2,s2=1(n2)i=1nei2,i=1nei2=i=1n(yiyi^)2=n2nE[s2]=n2nσ2E[s2]=σ2<σ2σ^ML2σ2.

確率変数の標準化

確率変数の標準化

期待値(平均)がμ, 分散がσ2の確率変数X

E[X]=μV[X]=σ2

確率変数の変換Z=Xμσ

Z=Xμσ

変換後の確率変数Zの期待値(平均)と分散

E[Z]=E[Xμσ]=1σE[Xμ]E[cX]=cE[X]=1σ(E[X]μ)E[X±t]=E[X]±t=1σ(μμ)E[X]=μ=1σ(0)=0V[Z]=V[Xμσ]=1σ2V[Xμ]V[cX]=c2V[X]=1σ2V[X]V[X±t]=V[X]=1σ2σ2V[X]=σ2=1 Xの分布によらず,Xの期待値(平均)と分散がμσ2であることからZの期待値(平均)と分散が0, 1と標準化される.

単回帰モデルの最尤推定

単回帰モデルの最尤推定

単回帰モデル

yi=α+βxi+ϵi(i=1,,n)ϵiiidN(0,σ2)(independentandidenticallydistributed;IID,i.i.d.,iid)

対数尤度凾数

対数尤度凾数は以下のようになる. f(y1,,yn;α,β,σ2)=i=1n12πσ2e12σ2(yiαβxi)2=(2π)n2(σ2)n2e12σ2i=1n(yiαβxi)2l(α,β,σ2;y1,,yn)=log{(2π)n2(σ2)n2e12σ2i=1n(yiαβxi)2}=log{(2π)n2}+log{(σ2)n2}+log{e12σ2i=1n(yiαβxi)2}=n2log(2π)n2log(σ2)12σ2i=1n(yiαβxi)2

スコア凾数

スコア凾数は以下のようになる. lα=lα{12σ2i=1n(yiαβxi)2}=12σ2i=1nlα(yiαβxi)2=12σ2i=1n(yiαβxi)(1)=12σ2i=1n(yiαβxi)=12σ2(i=1nyiαi=1n1βi=1nxi)=12σ2(ny¯nαnβx¯)x¯=1ni=1nxi,y¯=1ni=1nyi=n2σ2(y¯αβx¯) lβ=lβ{12σ2i=1n(yiαβxi)2}=12σ2i=1nlβ(yiαβxi)2=12σ2i=1n2(yiαβxi)(xi)=22σ2i=1n(xiyixiαβxi2)=1σ2(i=1nxiyii=1nxiαi=1nβxi2)=1σ2(i=1nxiyinx¯αβi=1nxi2)x¯=1ni=1nxi lσ2=lσ2{n2log(σ2)12σ2i=1n(yiαβxi)2}=n2lσ2log(σ2)12{i=1n(yiαβxi)2}lσ21σ2=n2lσ2log(σ2)12{i=1n(yiαβxi)2}lu1uu=σ2=n2lσ2log(σ2)12{i=1n(yiαβxi)2}(1u2)=n21σ212{i=1n(yiαβxi)2}(1σ4)u=σ2=12σ2{n1σ2i=1n(yiαβxi)2}

スコア凾数を連立させる

{0=lα0=lβ0=lσ2 {0=n2σ2(y¯αβx¯)0=1σ2(i=1nxiyinx¯αβi=1nxi2)0=12σ2{n1σ2i=1n(yiαβxi)2} α,β,σ2の推定量をα^,β^,σ^2とし,α^,β^,σ^2の最尤推定量(maximum likelihood estimator)をα^ML,β^ML,σ^ML2とする. {0=y¯α^MLβ^MLx¯0=i=1nxiyinx¯α^MLβ^MLi=1nxi20=n1σML2i=1n(yiα^MLβ^MLxi)2

α^MLを求める

0=y¯α^MLβ^MLx¯α^ML=y¯β^MLx¯

β^MLを求める

0=i=1nxiyinx¯α^MLβ^MLi=1nxi2=i=1nxiyinx¯(y¯β^MLx¯)β^MLi=1nxi2α^ML=y¯β^MLx¯=i=1nxiyinx¯y¯+nβ^MLx¯2β^MLi=1nxi2=i=1nxiyinx¯y¯β^ML{(i=1nxi2)nx¯2}=i=1n(xix¯)(yiy¯)β^MLi=1n(xix¯)2=Sxyβ^MLSxxSxy=i=1n(xix¯)(yiy¯),Sxx=i=1n(xix¯)2β^ML=SxySxx=β^α^ML=y¯β^MLx¯=y¯β^x¯=α^

σ^ML2を求める

0=n1σML2i=1n(yiα^MLβ^MLxi)2n=1σML2i=1n(yiα^MLβ^MLxi)2nσML2=i=1n(yiα^MLβ^MLxi)2σ^ML2=1ni=1n(yiα^MLβ^MLxi)2=1ni=1n(yiα^β^xi)2=1ni=1n(yiy^i)2y^i=α^+β^xi=1ni=1nei2=1n(n2)s2i=1nei2=(n2)s2,s2=1n2i=1nei2=n2ns2

α^ML,β^ML,σ^ML2

以上より最尤推定量α^ML,β^ML,σ^ML2は以下のようになる. β^ML=SxySxx=β^α^ML=y¯β^MLx¯=y¯β^x¯=α^σ^ML2=n2ns2

確率変数の変数変換 Z=X/Y

確率変数の変数変換 Z=X/Y

Z=X/Y

pX/Y(z)=δ(zxy)f(x)g(y)dxdyδ(x)f(x)dx=f(0)X=x,Y=yf(x)g(x)z(xy)=0.=|y|δ(xyz)f(x)g(y)dxdyδ(u(x))=αu1(0)1|u(α)|δ(xα)u(x)=zxyu(x=α)=0,α=yzu=dudx=ddx(zxy)=1yδ(zxy)=1|u(α)|δ(xα)=1|1y|δ(xyz)=1|1y|δ(xyz)=|y|δ(xyz)=|y|δ(yzyz)f(yz)g(y)dyz=xy,x=yz=|y|δ(0)f(yz)g(y)dy=|y|f(yz)g(y)dyδ0|y|f(yz)g(y).

標準正規分布同士の例

fX(x)=12πex22N(0,1)()gY(y)=12πey22N(0,1)()pX/Y(z)=δ(zxy)fX(x)gY(y)dxdy=δ(zxy)12πex2212πey22dxdy=|y|12πe(yz)2212πey22dyz=xy,x=yz=12π|y|e(yz)22ey22dycf(x)dx=cf(x)dx=12π|y|e(yz)22y22dyABAC=AB+C=12π|y|ey2(z2+1)2dy=12π{0|y|ey2(z2+1)2dy+0|y|ey2(z2+1)2dy}ABf(x)dx=ACf(x)dx+CBf(x)dx(ACB)=12π{0yey2(z2+1)2dy+0yey2(z2+1)2dy}|A|={A(A0)A(A<0)=12π20yey2(z2+1)2dyy=xy=ex2(z2+1)2.(,0)(0,).f(,0)(x)+f(0,)(x)=f(x)dx(a,a)(0,a)2.aaf(x)dx=20af(x)dx=1π0yey2(z2+1)2dy=1π0yet1(z2+1)ydtt=y2(z2+1)2,dtdy=(z2+1)22y=(z2+1)y,dy=1(z2+1)ydt=1π1(z2+1)0etdtcf(x)dx=cf(x)dx=1π1(z2+1)10etdt=[et]0=[(e)(e0)]=[0+1]=1=1π1(z2+1).f(x;x0,γ)=1πγ(xx0)2+γ2(Cauchydistribution)f(x;0,1)=1π1(x0)2+12=1π1x2+1

指数分布同士の例

fX(x)=λeλx(x0,λ>0)gY(y)=λeλy(x0,λ>0)pX/Y(z)=δ(xzy)fX(x)gY(y)dxdy=δ(xzy)λeλxλeλydxdy=0|y|λeλyzλeλydyz=xy,x=yz=λ20|y|eλyzeλydycf(x)dx=cf(x)dx=λ20|y|eλyzλydyABAC=AB+C=λ20|y|eλy(z+1)dy=λ20yeλy(z+1)dyy>0()=λ20tλ(z+1)et1λ(z+1)dtt=λ(z+1)y,y=tλ(z+1)dtdy=λ(z+1),dy=1λ(z+1)dt=λ2{1λ(z+1)}20tetdtcf(x)dx=cf(x)dx=1(z+1)20tetdt=1(z+1)20t(et)dt(et)=et=1(z+1)2{[tet]00etdt}abf(x)g(x)dx=[f(x)g(x)]ababf(x)g(x)dx=1(z+1)2{[()e(0e0)]+0etdt}=1(z+1)2(0+1)0etdt=[et]0=[(e)(e0)]=[0+1]=1=1(z+1)2

確率変数の変数変換 Z=XY

確率変数の変数変換 Z=XY

Z=XY

pXY(z)=δ(zxy)f(x)g(y)dxdyδ(x)f(x)dx=f(0)X=x,Y=yf(x)g(x)z(xy)=0.=1|y|δ(xzy)f(x)g(y)dxdyδ(u(x))=αu1(0)1|u(α)|δ(xα)u(x)=zxyu(x=α)=0,α=zyu=dudx=ddx(zxy)=yδ(zxy)=1|u(α)|δ(xα)=1|y|δ(xzy)=1|y|δ(xzy)=1|y|δ(zyzy)f(zy)g(y)dyz=xy,x=zy=1|y|δ(0)f(zy)g(y)dy=1|y|f(zy)g(y)dyδ01|y|f(zy)g(y).

標準正規分布同士の例

fX(x)=12πex22N(0,1)()gY(y)=12πey22N(0,1)()pXY(z)=δ(zxy)fX(x)gY(y)dxdy=δ(zxy)12πex2212πey22dxdy=1|y|12πe(zy)2212πey22dyz=xy,x=zy=12π1|y|e(zy)22ey22dycf(x)dx=cf(x)dx=12π1|y|e12(z2y2+y2)dy=12π{01|y|e12(z2y2+y2)dy+01|y|e12(z2y2+y2)dy}ABf(x)dx=ACf(x)dx+CBf(x)dx(ACB)=12π{01ye12(z2y2+y2)dy+01ye12(z2y2+y2)dy}1|y|=1y(y<0),1|y|=1y(0<y)=12π201ye12(z2y2+y2)dyy=1xy=e12(z2x2+x2).(,0)(0,).f(,0)(x)+f(0,)(x)=f(x)dx(a,a)(0,a)2.aaf(x)dx=20af(x)dx=1π01ye12(z2y2+y2)dy=1π0e12{z2y2+y2}dt2tt=y22,y2=2t,y:0,t:0dtdy=y=y2y=2ty,dyy=dt2t=1π1201te12{z22t+2t}dt=12π01tetz24tdtKn(z)=12(z2)n0tn1etz24tdt()K0(z)=120t1etz24tdt=1πK0(z)

指数分布同士の例

fX(x)=λeλx(x0,λ>0)gY(y)=λeλy(x0,λ>0)pXY(z)=δ(xxy)fX(x)gY(y)dxdy=δ(xxy)λeλxλeλydxdy=01|y|λeλ(zy)λeλydyz=xy,x=zy=λ201|y|eλ(zy)eλydycf(x)dx=cf(x)dx=λ201|y|eλ(zy)λydyABAC=AB+C=λ201|y|eλ(zy+y)dy=λ201|tλ|eλ(ztλ+tλ)1λdtt=λy,y=tλ,dydt=1λ,dy=1λdt,y:0,t:0=λ20|λ||t|eλ2ztt1λdt=λ20|λ|λ1|t|eλ2zttdt=λ201|t|eλ2zttdtλ>0=λ201teλ2zttdtt>0()=2λ2K0(2λz)Kn(z)=12(z2)n0tn1etz24tdt()K0(z)=120t1etz24tdt

確率変数の変数変換 Z=X+Y

確率変数の変数変換 Z=X+Y

Z=X+Y

pX+Y(z)=δ(z(x+y))f(x)g(y)dxdyδ(x)f(x)dx=f(0)X=x,Y=yf(x)g(x)z(x+y)=0.=δ(z((zy)+y))f(zy)g(y)dyz=x+y,x=zy=δ(0)f(zy)g(y)dy=f(zy)g(y)dyδ0f(zy)g(y).

標準正規分布同士の例

fX(x)=12πex22N(0,1)()gY(y)=12πey22N(0,1)()pX+Y(z)=δ(z(x+y))fX(x)gY(y)dxdy=δ(z(x+y))12πex2212πey22dxdy=12πe(zy)2212πey22dyz=x+y,x=zy=12πe(zy)22ey22dycf(x)dx=cf(x)dx=12πe(zy)22y22dyABAC=AB+C=12πe(zy)2+y22dy=12πez22yz+y2+y22dy=12πez22yz+2y22dy=12πez22+yzy2dy=12πez22+z24z24+yzy2dy=12πez24(z24yz+y2)dy=12πez24e(z24yz+y2)dy=12πez24e(z2y)2dy=12πez24et2(1)dtt=z2y,dtdy=1,dy=dt,y:,t:=12πez24(1)et2dtcf(x)dx=cf(x)dx=12πez24(1)(et2dt)ABf(x)dx=BAf(x)dx=12πez24et2dt=12πez24πet2dy=π=12πez24=12π2ez222N(0,2)

指数分布同士の例

fX(x)=λeλx(x0,λ>0)Exp(λ)()gY(y)=λeλy(x0,λ>0)Exp(λ)()pX+Y(z)=δ(z(x+y))fX(x)gY(y)dxdy=δ(z(x+y))λeλxλeλydxdy=0zλeλ(zy)λeλydyz=x+y,x=zy=λ20zeλ(zy)eλydycf(x)dx=cf(x)dx=λ20zeλ(zy)λydyABAC=AB+C=λ20zeλ(zy+y)dy=λ20zeλzdy=λ2eλz0zdycf(x)dx=cf(x)dx=λ2eλz[y]0z=λ2eλz[z0]=λ2zeλz=Γ(2,λ) Γ(α,λ)=1Γ(α)λαxα1eλx(;gammadisribution)Γ(1,λ)=1Γ(1)λ1x11eλx=11λeλx=λeλxΓ(1)=(11)!=0!=1Γ(2,λ)=1Γ(2)λ2x21eλx=11λ2xeλx=λ2xeλxΓ(2)=(21)!=1!=1,α=2

デルタ凾数(delta function)

デルタ凾数(delta function)

以下の式を満たすδ(x)をデルタ凾数と呼ぶ. δ(x)f(x)dx=f(0) これはf(x)の積分の中からx=0(δ(0))となる時のf(x)のみを取り出すことになる.

上記式を満たすため,δ(x)のみでの積分値は1でとされる. δ(x)dx=1f(x)=1

デルタ凾数の性質

δ(xα)の場合

足し合わせたいxの値を動かす.これはf(x)の積分の中からx=α(δ(αα)=δ(0))となる時のf(α)のみを取り出すことになる. δ(xα)f(x)dx=δ(t)f(t+α)dtt=xα,x=t+α,dxdt=1,dx=dtx:,t:=f(α)

δ(αx)の場合

f(x)δ(x)でスケールがα倍異なる場合の性質を求める. δ(αx)f(x)dx=δ(t)f(tα)dtαt=αx,x=tαdxdt=1α,dx=dtαx:,t:={δ(t)f(tα)dt|α|(α>0)a=|a|(a>0)δ(t)f(tα)dt|α|(α<0)a=|a|(a<0)=δ(t)f(tα)dt|α|t=0δ(t)=0δ(t)=0f(t),αα=1|α|δ(t)f(tα)dt=1|α|f(0)cf(x)dx=cf(x)dx=1|α|δ(t)f(x)dtδ(αx)=1|α|δ(t)

δ(u(x))の場合

足し合わせたいxの値を動かす.u(x)=0を満たすxx=α1,,αk,,αnとするとこれはf(x)の積分の中からx=αk(δ(αkαk)=δ(0))となる時のf(αk)のみを取り出すことになり,積分はその足し合わせとなる.

u(x)=0の解x=αkが区間にただ一つとなるようにϵを十分小さくとるとする. αkϵαk+ϵδ(u(x))f(x)dx=αkϵαk+ϵδ(u(αk)+u(αk)(xαk)+12!u(αk)(xαk)2+)f(x)dxu(x)x=αaf(x):f(x)=f(a)+f(a)(xa)+12f(a)(xa)2+=αkϵαk+ϵδ(0+u(αk)(xαk)+0)f(x)dxu(αk)αk0(xαk)=±ϵϵ2,0.=αkϵαk+ϵδ(u(αk)(xαk))f(x)dx=αkϵαk+ϵ1|u(αk)|δ(xαk)f(x)dxδ(αx)=1|α|δ(t)() よって全区間では以下のようになる. δ(u(x))f(x)dx=k=1nαkϵαk+ϵδ(u(x))f(x)dx=k=1nαkϵαk+ϵ1|u(αk)|δ(xαk)f(x)dx={k=1n1|u(αk)|δ(xαk)}f(x)dx δ(u(x))=k=1n1|u(αk)|δ(xαk)(αku(x)=0)=αu1(0)1|u(α)|δ(xα)

確率母凾数 ( probability generating function )

確率母凾数

非負の整数値をとる離散型確率変数Xに対して以下のように確率母凾数(probability generating function;積率母凾数ではない)が定義される. GX(t)=E[tX]MX(t)=E[etX]=ktkP(X=k)P(X):,k:Xk

一階微分((原点周りの)一次モーメント) = 期待値

GX(1)(t)|t=1=ddtGX(t)|t=1=k1ktk1P(X=k)|t=1=k1k1k1P(X=k)=k1kP(X=k)=E[X]

二階微分((原点周りの)二次モーメント)

GX(2)(t)|t=1=d2dt2GX(t)|t=1=ddtk1ktk1P(X=k)|t=1=k2k(k1)tk2P(X=k)|t=1=k2k(k1)1k2P(X=k)=k2k(k1)P(X=k)=E[X(X1)]

分散((母平均周りの)二次モーメント)

V[X]=E[(XE[X])2]=E[X2]E[X]2E[(XE[X])2]=E[X2][X]2=E[X2]E[X]+E[X]E[X]2=E[X2X]+E[X]E[X]2E[X±Y]=E[X]±E[Y]=E[X(X1)]+E[X]E[X]2=(GX(2)(t)|t=1)+(GX(1)(t)|t=1)(GX(1)(t)|t=1)2

Z=X+Y

GZ(t)=E[tZ]=E[tX+Y]=E[tXtY]AB+C=ABAC=E[tX]E[tY]E[AB]=E[A]E[B]AB=GX(t)GY(t)

二項分布(binomial distribution)の積率母凾数(moment-generating function)と期待値(expected value)・分散(variance)

二項分布(binomial distribution)の積率母凾数(moment-generating function)と期待値(expected value)・分散(variance)

二項分布

XB(n,p)f(X=x)={nCxpx(1p)nxx{0,1,2,,n}0x{0,1,2,,n}

積率母凾数

MX(t)=E[etx]=k=0netxnCxpx(1p)nx=k=0nnCx(etp)x(1p)nx=nC0(etp)0(1p)n0+nC1(etp)1(1p)n1+nC2(etp)2(1p)n2++nCn(etp)n(1p)nn={etp+(1p)}n(A+B)D=DC0A0BD0+DC1A1BD1++DCDADBDD=k=0DDCkAkBDk()=(etpp+1)n

(原点周りの)一次モーメント = 期待値

E[X]=MX(1)(t)=dMX(t)dt|t=0=ddt(etpp+1)n|t=0=dduundudt|t=0u=etpp+1,dudt=ddt(etpp+1)=etp=nun1etp|t=0=n(etpp+1)n1etp|t=0=npet(etpp+1)n1|t=0=npe0(e0pp+1)n1=np1(1pp+1)n1=np(1)n1=npX

(原点周りの)二次モーメント

E[X2]=MX(2)(t)=d2MX(t)dt2|t=0=d2dt2(etpp+1)n|t=0=ddtnpet(etpp+1)n1|t=0=npddtet(etpp+1)n1|t=0ddxcf(x)=cddxf(x)(c:)=npddtuv|t=0u=et,v=(etpp+1)n1=np{(ddtu)v+u(ddtv)}|t=0=np[(et)v+u{(n1)(etpp+1)n2pet}]|t=0dudt=et,dvdt=(n1)(etpp+1)n2pet=np[(et)(etpp+1)n1+et{(n1)(etpp+1)n2pet}]|t=0u=et,v=(etpp+1)n1=npet(etpp+1)n1+n(n1)p2e2t(etpp+1)n2|t=0=npe0(e0pp+1)n1+n(n1)p2e20(e0pp+1)n2=np1(1pp+1)n1+n(n1)p21(1pp+1)n2=np(1)n1+n(n1)p2(1)n2=np+n(n1)p2

二次の中心(化)モーメント / 母平均周りの二次モーメント = 分散

V[X]=E[(XE[X])2]=E[X2]E[X]2E[(XE[X])2]=E[X2][X]2=MX(2)(t)(MX(1)(t))2=np+n(n1)p2(np)2=np+n2p2np2n2p2=npnp2=np(1p)X(X1)

正規分布に従う互いに独立な標本における分散の最尤推定量を求める

正規分布に従う互いに独立な標本における分散の最尤推定量を求める

x1,,xnN(μ,σ2)からの独立な観測値とする時のσ2の最尤推定を考える.

確率密度凾数

XkN(μ,σ2)f(x;μ,σ2)=12πσ2e(xμ)22σ2f(x1,,xn;μ,σ2)={12πσ2e(x1μ)22σ2}{12πσ2e(x2μ)22σ2}{12πσ2e(xnμ)22σ2}=(12πσ2)ne12σ2k=1n(xkμ)2

μが既知の場合のσ2の最尤推定

確率密度凾数から尤度凾数(確率密度凾数に対して,確率変数や既知のパラメータを定数として,未知のパラメータを変数とみなす)の対数をとり,対数尤度凾数を用意する. l(σ2;x1,,xn,μ)=log{(12πσ2)ne12σ2k=1n(xkμ)2}=log{(12πσ2)n}+log{e12σ2k=1n(xkμ)2}log(AB)=log(A)+log(B)=log{(2πσ2)n2}+log{e12σ2k=1n(xkμ)2}1A=A1=n2log(2πσ2)12σ2k=1n(xkμ)2log(e)log(AB)=Blog(A)=n2log(2πσ2)12σ2k=1n(xkμ)2log(e)=1 極値を考えるために変数であるσ2で微分する(スコア凾数). ddσ2l(σ2;x1,,xn,μ)=ddσ2{n2log(2πσ2)12σ2k=1n(xkμ)2}=n2ddσ2log(2πσ2)12{k=1n(xkμ)2}ddσ21σ2ddx{f(x)+g(x)}=ddxf(x)+ddxg(x),ddxcf(x)=cddxf(x)=n2ddulog(u)dudσ212{k=1n(xkμ)2}ddvv1dvdσ2u=2πσ2,dudσ2=2π,v=σ2,dvdσ2=1=n21u2π12{k=1n(xkμ)2}(v2)1=n212πσ22π12{k=1n(xkμ)2}{(σ2)2}u=2πσ2,v=σ2=n21σ212{k=1n(xkμ)2}{1(σ2)2}=n2σ2+12σ4{k=1n(xkμ)2}(AB)C=ABC この式が0となるσ2(=σ^2)を求める(極値である). ddσ2l(σ2;x1,,xn,μ)=n2σ^2+12σ4{k=1n(xkμ)2}=012σ^2[n+1σ^2{k=1n(xkμ)2}]=0n+1σ^2{k=1n(xkμ)2}=012σ^2σ^200[]01σ^2{k=1n(xkμ)2}=n1σ^2=nk=1n(xkμ)2σ^2=1nk=1n(xkμ)2

μが未知の場合のσ2の最尤推定

対数尤度凾数を用意する(上と同じ). l(μ,σ2;x1,,xn)=n2log(2πσ2)12σ2k=1n(xkμ)2 極値を考えるために変数であるμ,σ2でそれぞれ偏微分する(スコア凾数). μl(μ,σ2;x1,,xn)=μ{n2log(2πσ2)12σ2k=1n(xkμ)2}=μ{n2log(2πσ2)}+μ{12σ2k=1n(xkμ)2}x{f(x,y)+g(x,y)}=xf(x,y)+xg(x,y)=12σ2ddμk=1n(xkμ)2ddxc=0,ddxcf(x)=cddxf(x)=12σ2k=1nddμ(xkμ)2ddxk=1nf(xk)=ddx{f(x1)++f(xn)}=ddxf(x1)++ddxf(xn)=k=1nddxf(xk)=12σ2k=1ndduu2dudμu=xkμ,dudμ=1=12σ2k=1n2u1=12σ2k=1n2(xkμ)u=xkμ=12σ2(2)k=1n(xkμ)=1σ2k=1n(xkμ)σ2l(μ,σ2;x1,,xn)=σ2{n2log(2πσ2)12σ2k=1n(xkμ)2}=n2σ2+12σ4{k=1n(xkμ)2}l(σ2;x1,,xn,μ) これらの式が0となる連立方程式としてμ(=μ^),σ2(=σ~2)を求める(極値である). {1σ~2k=1n(xkμ^)=0n2σ~2+12σ~4{k=1n(xkμ^)2}=0 第一式より 1σ~2k=1n(xkμ^)=0k=1n(xkμ^)=01σ~2σ~200k=1nxkk=1nμ^=0(AB)=ABk=1nxknμ^=0k=1nc=nc(c:)nμ^=k=1nxkμ^=1nk=1nxk=x¯x¯=1nk=1nxk 第二式のμ^にこれを代入してσ~2の最尤推定量を得る. n2σ~2+12σ~4{k=1n(xkμ^)2}=0n2σ~2+12σ~4{k=1n(xkx¯)2}=0μ^=x¯12σ~2[n+1σ~2{k=1n(xkx¯)2}]=0n+1σ~2{k=1n(xkx¯)2}=012σ~2σ~200[]01σ~2{k=1n(xkx¯)2}=n1σ~2=nk=1n(xkx¯)2σ~2=1nk=1n(xkx¯)2=s2s2=1nk=1n(XkX)2=n1nσ^2σ^2=1n1k=1n(XkX)2

XY平面上の線分同士の交点

線分同士の交点

XYAB,CDG

u=AB=(ux,uy)=(xbxa,ybya)A(xa,ya),B(xb,yb)v=CD=(vx,vy)=(xdxc,ydyc)C(xc,yc),D(xd,yd)w=AC=(wx,wy)=(xcxa,ycya)A,Bu×v=uxvyvxuy=(xbxa)(ydyc)(xdxc)(ybya)sin(θ)=u×v|u||v|α×β=XY=|α||β|sin(x)2sin(θ)()XYXY()sin(θ)<0sin(θ)=v×u|v||u|

AGAGABの比AGAB

AE=|w|sin(πϕ)=|w|sin(ϕ)sin(πx)=sin(x)=|w|w×v|w||v|α×β=|α||β|sin(x),sin(x)=α×β|α||β|=w×v|v|AE=AGsin(πθ)=AGsin(θ)sin(πx)=sin(x)AG=AEsin(θ)=w×v|v|1sin(θ)=w×v|v||u||v|u×v=w×vu×v|u|AGAB=AG|u|=w×vu×v|u|1|u|=w×vu×v=wxvyvxwyuxvyvxuy=(xcxa)(ydyc)(xdxc)(ycya)(xbxa)(ydyc)(xdxc)(ybya)

CGCGCDの比CGCD

CF=|w|sin(πψ)=|w|sin(ψ)sin(πx)=sin(x)=|w|w×u|w||u|α×β=|α||β|sin(x),sin(x)=α×β|α||β|=w×u|u|CF=CGsin((πθ))=CGsin(θ)sin(πx)=sin(x)CG=CFsin(θ)=w×u|u|1sin(θ)=w×u|u||v||u|v×u=w×uv×u|v|CGCD=CG|v|=w×uv×u|v|1|v|=w×uv×u=w×u(u×v)A×B=(B×A)=w×uu×v=wxuyuxwyuxvyvxuy=(xcxa)(ybya)(xbxa)(ycya)(xbxa)(ydyc)(xdxc)(ybya)

交点の有無について

CGCDAGABは共に 分母にu×vがあるが, これが0というのはsin(θ)=0ということであり,線分同士がなす角θ0πであり,互いにAB,CDが平行ということなのでGを持たない. 0での割り算を発生させないためこれは例外としてCGCDとAGABを求めるより先に判定する必要がある.
その後,CGCDとAGABを求め,共に0より大きく1以下の値の時,Gを持つことになる. それ以外の場合はGが線分の外側に存在することになる.

単回帰における残差平方和の期待値

単回帰における残差平方和の期待値

誤差の平方和

i=1nϵi2=i=1n(yiαβxi)2yi=α+βxi+ϵi,:ϵiiidN(0,σ2)N(0,σ2).=i=1n(yiαβxi+y¯α^β^x¯+β^xiβ^xi+βx¯βx¯)2y¯α^β^x¯=0=i=1n(yiα^β^xi+y¯αβx¯+β^xiβ^x¯βxi+βx¯)2=i=1n[(yiα^β^xi)+(y¯αβx¯)+(β^xiβ^x¯βxi+βx¯)]2=i=1n[(yiα^β^xi)+(y¯αβx¯)+{(β^β)(xix¯)}]2=i=1n[(yiα^β^xi)2+(y¯αβx¯)2+{(β^β)(xix¯)}2+2(yiα^β^xi)(y¯αβx¯)+2(yiα^β^xi)(β^β)(xix¯)+2(y¯αβx¯)(β^β)(xix¯)](A+B+C)2=A2+B2+C2+2AB+2AC+2BC=i=1n(yiα^β^xi)2+i=1n(y¯αβx¯)2+i=1n(β^β)2(xix¯)2+2i=1n(yiα^β^xi)(y¯αβx¯)+2i=1n(yiα^β^xi)(β^β)(xix¯)+2i=1n(y¯αβx¯)(β^β)(xix¯)=i=1n(yiα^β^xi)2+i=1n(y¯αβx¯)2+(β^β)2i=1n(xix¯)2+20+20+20i=1n(yiα^β^xi)(y¯αβx¯)=0()i=1n(yiα^β^xi)(β^β)(xix¯)=0()i=1n(y¯αβx¯)(β^β)(xix¯)0()=i=1n(yiyi^)2+n(y¯αβx¯)2+(β^β)2Sxxyi^=α^+β^xi,Sxx=i=1n(xix¯)2=i=1nei2+n(y¯αβx¯)2+(β^β)2Sxxei=yiyi^

残差平方和Se

前述の式でi=1nϵi2i=1nei2を入れ替えて(互に移項して)以下の式を得る. i=1nei2=i=1n(yiyi^)2(sumofsquaresofresiduals;Se)=i=1nϵi2n(y¯αβx¯)2(β^β)2Sxx

残差平方和の期待値E[Se]

E[i=1nei2]=E[i=1nϵi2n(y¯αβx¯)2(β^β)2Sxx]=E[i=1nϵi2]E[n(y¯αβx¯)2]E[(β^β)2Sxx]E[X+Y]=E[X]+E[Y]=i=1nE[ϵi2]E[n(y¯αβx¯)2]E[(β^β)2Sxx]E[i=1nXi]=E[X1++Xn]=E[X1]++E[Xn]=i=1nE[Xi]=i=1n(V[ϵi]+E[ϵi]2)E[n(y¯αβx¯)2]E[(β^β)2Sxx]V[X]=E[(XE[X])2]=E[X2]E[X]2,E[X2]=V[X]+E[X]2=i=1n(σ2+02)E[n(y¯αβx¯)2]E[(β^β)2Sxx]ϵiiidN(0,σ2),E[ϵi]=0,V[ϵi]=σ2=i=1nσ2E[n(y¯αβx¯)2]E[(β^β)2Sxx]=σ2i=1n1E[n(y¯αβx¯)2]E[(β^β)2Sxx]=nσ2nE[(y¯αβx¯)2]SxxE[(β^β)2]E[cX]=cE[X]=nσ2nV[y¯]SxxV[β^]V[X+t]=V[X](t:)=nσ2nσ2nSxxV[SxySxx]V[y¯]=σ2n,β^=SxySxx=nσ2nσ2nSxx1Sxx2V[Sxy]V[cX]=c2V[X](c:)=nσ2σ21Sxxσ2SxxV[Sxy]=σ2Sxx=nσ2σ2σ2=(n2)σ2(Se) よって(n2)で残差平方和を割っておけばσ2が得られ不偏推定量となる. E[i=1nei2]=(n2)σ21n2E[i=1nei2]=σ2E[1(n2)i=1nei2]=σ2cE[X]=E[cX]E[s2]=σ2s2=1(n2)i=1nei2σ2

標準化残差eisとその分布

eiseis(standardizedresiduals),s1(n2)i=1nei2ei=yiyi^=(α+βxi+ϵi)(α^+β^xi)=(αα^)+(ββ^)xi+ϵi nが十分大きい時α^,β^α,βに確率収束する( α^,β^は不偏推定量(期待値はα,β) ).よって eiϵi(αα^),(ββ^)01,2 となる.また, eis=eis は, ϵisϵiσn,sσ(s2(σ2)) と同じ分布に従うとみなせる.
ϵiN(0,σ2)に従うのでϵisN(0,12)に従うと考えられる.

誤差の平方和の計算途中の式について

i=1n(yiα^β^xi)(y¯αβx¯)=(y¯αβx¯)i=1n(yiα^β^xi)=(y¯αβx¯)(i=1nyiα^i=1n1β^i=1nxi)=(y¯αβx¯)(ny¯nα^nβ^x¯)=(y¯αβx¯)n(y¯α^β^x¯)=(y¯αβx¯)n0y¯α^β^x¯=0=0i=1n(yiα^β^xi)(β^β)(xix¯)=(β^β)i=1n(yiα^β^xi)(xix¯)=(β^β)i=1n{(yiα^β^xi)xi(yiα^β^xi)x¯}=(β^β){i=1n(yiα^β^xi)xii=1n(yiα^β^xi)x¯}=(β^β){i=1n(yiα^β^xi)xix¯i=1n(yiα^β^xi)}=(β^β){i=1n(yiα^β^xi)xix¯(i=1nyii=1nα^i=1nβ^xi)}=(β^β){i=1n(yiα^β^xi)xix¯(ny¯nα^β^nx¯)}=(β^β){i=1n(yiα^β^xi)xix¯n(y¯α^β^x¯)}=(β^β){i=1n(yiα^β^xi)xix¯n0}=(β^β){i=1n(yiα^β^xi)xi0}=(β^β)i=1n(yixiα^xiβ^xi2)=(β^β){i=1nyixii=1nα^xii=1nβ^xi2}=(β^β){i=1nyixiα^i=1nxiβ^i=1nxi2}=(β^β){i=1nyixiα^nx¯β^i=1nxi2}i=1nyixiα^nx¯β^i=1nxi2=0(α^,β^調)=(β^β)0=0i=1n(y¯αβx¯)(β^β)(xix¯)=(y¯αβx¯)(β^β)i=1n(xix¯)=(y¯αβx¯)(β^β)(i=1nxix¯i=1n1)=(y¯αβx¯)(β^β)(nx¯nx¯)i=1nxi=nx¯=(y¯αβx¯)(β^β)0=0