間違いしかありません.コメントにてご指摘いただければ幸いです(気が付いた点を特に断りなく頻繁に書き直していますのでご注意ください).

共分散(covariance)

共分散(covariance)

Cov[X,Y]=E[(XE[X])(YE[Y])](covariance)Cov[c0Xi,c1Xj]=E[(c0XiE[c0Xi])(c1XjE[c1Xj])]Cov[X,Y]=E[(XE[X])(YE[Y])]=E[(c0Xic0E[X¯])(c1Xjc1E[X¯])]E[cX]=cE[X]=E[c0(XiE[X¯])c1(XjE[X¯])]=c0c1E[(XiE[X¯])(XjE[X¯])]E[cX]=cE[X]=c0c1Cov[Xi,Xj]V[i=1nXi]=V[X1++Xi++Xn]=E[{(X1++Xi++Xn)E[X1++Xi++Xn]}2]=E[{X1++Xi++XnE[X1]E[Xi]E[Xn]}2]=E[{(X1E[X1])++(XiE[Xi])++(XnE[Xn])}2]=E[(X1E[X1])2++(X1E[X1])(XjE[Xj])++(X1E[X1])(XnE[Xn])++(XiE[Xi])(X1E[X1])++(XiE[Xi])(XjE[Xj])++(XiE[Xi])(XnE[Xn])++(XnE[Xn])(X1E[X1])++(XnE[Xn])(XjE[Xj])++(XnE[Xn])2]=E[(X1E[X1])2]++E[(X1E[X1])(XjE[Xj])]++E[(X1E[X1])(XnE[Xn])]++E[(XiE[Xi])(X1E[X1])]++E[(XiE[Xi])(XjE[Xj])]++E[(XiE[Xi])(XnE[Xn])]++E[(XnE[Xn])(X1E[X1])]++E[(XnE[Xn])(XjE[Xj])]++E[(XnE[Xn])2]E[X+Y]=E[X]+E[Y]=Cov[X1,X1]++Cov[X1,Xj]++Cov[X1,Xn]++Cov[Xi,X1]++Cov[Xi,Xj]++Cov[Xi,Xn]++Cov[Xn,X1]++Cov[Xn,Xj]++Cov[Xn,Xn]=i=1nj=1nCov[Xi,Xj]E[(XiE[Xi])(XjE[Xj])]=Cov[Xi,Xj]=i=1nCov[Xi,Xi]+2i<jCov[Xi,Xj]CovCov[Xi,Xj]=Cov[Xj,Xi]i<ji>j22=i=1nV[Xi]+2i<jCov[Xi,Xj]Cov[Xi,Xi]=V[Xi]

単回帰における最小二乗推定量の分散(variance)・共分散(covariance)

単回帰における最小二乗推定量α^,β^の分散(variance)・共分散(covariance)

単回帰における観測値yiの分散・共分散について

yi=α+βxi+ϵi(i=1,,n){ϵi|i=1,,n}:ϵiiidN(0,σ2)(independentandidenticallydistributed;IID,i.i.d.,iid)E[ϵi]=0,V[ϵi]=σ2,(Cov[ϵi,ϵj]={V[ϵi]=σ2(i=j)0(ij))V[yi]=V[α+βxi+ϵi]=V[ϵi]V[X±t]=V[X](t:)=σ2Cov[yi,yj]=E[(yiE[yi])(yjE[yj])]Cov[X,Y]=E[(XE[X])(YE[Y])]=E[(α+βxi+ϵiE[α+βxi+ϵi])(α+βxj+ϵjE[α+βxj+ϵj])]yi=α+βxi+ϵi=E[(α+βxi+ϵiαβxiE[ϵi])(α+βxj+ϵjαβxjE[ϵj])]E[X±t]=E[X]±t=E[(ϵiE[ϵi])(ϵjE[ϵj])]=Cov[ϵi,ϵj] 上記を踏まえて(xix¯)を加えた分散・共分散について Cov[(xix¯)(yiy¯),(xjx¯)(yjy¯)]=(xix¯)(xjx¯)Cov[(yiy¯),(yjy¯)]Cov[c0Xi,c1Xj]=c0c1Cov[Xi,Xj]=(xix¯)(xjx¯)E[{(yiy¯)E[yiy¯]}{(yjy¯)E[yjy¯]}]Cov[X,Y]=E[(XE[X])(YE[Y])]=(xix¯)(xjx¯)E[{yiy¯E[yi]+y¯}{yjy¯E[yj]+y¯}]E[X±t]=E[X]±t=(xix¯)(xjx¯)E[(yiE[y¯])(yjE[y¯])]=(xix¯)(xjx¯)Cov[yi,yj]Cov[X,Y]=E[(XE[X])(YE[Y])]={(xix¯)2σ2(i=j)(xix¯)(xjx¯)0(ij)Cov[yi,yj]=Cov[ϵi,ϵj]={V[ϵi]=σ2(i=j)0(ij)V[(xix¯)yi]=(xix¯)2V[yi]V[cX]=c2V[X]=(xix¯)2σ2i=j

Sxyの分散

V[Sxy]=V[i=1n(xix¯)(yiy¯)]Sxy=i=1n(xix¯)(yiy¯)=i=1nV[(xix¯)(yiy¯)]+2i<jCov[(xix¯)(yiy¯),(xjx¯)(yjy¯)]V[i=1nXi]=i=1nV[Xi]+2i<jCov[Xi,Xj]=i=1n(xix¯)2σ2+2i<j0V[(xix¯)(yiy¯)]=(xix¯)2σ2Cov[(xix¯)(yiy¯),(xjx¯)(yjy¯)]=0(ij)=σ2i=1n(xix¯)2i=0ncXi=ci=0nXi=σ2SxxSxx=i=1n(xix¯)2

最小2乗推定量β^の分散

V[β^]=V[SxySxx]β^=SxySxx,Sxx=i=1n(xix¯)2,Sxy=i=1n(xix¯)(yiy¯)=1Sxx2V[Sxy]V[cX]=c2V[X]=1Sxx2σ2SxxV[Sxy]=σ2Sxx=1Sxxσ2

最小2乗推定量α^の分散

V[α^]=V[y¯β^x¯]α^=y¯β^x¯=V[y¯SxySxxx¯]β^=SxySxx,Sxx=i=1n(xix¯)2,Sxy=i=1n(xix¯)(yiy¯)=V[y¯]+V[SxySxxx¯]2Cov[y¯,SxySxxx¯]V[X±Y]=V[X]±2Cov[X,Y]+V[Y]=V[y¯]+V[SxySxxx¯]20Cov[y¯,SxySxxx¯]=0()=V[y¯]+x¯2Sxx2V[Sxy]=V[1ni=1nyi]+x¯2Sxx2σ2SxxV[Sxy]=σ2Sxx=1n2V[i=1nyi]+x¯2Sxxσ2V[cX]=c2V[X]=1n2{i=1nV[yi]+2i<jCov[yi,yj]}+x¯2Sxxσ2V[i=1nXi]=i=1nV[Xi]+2i<jCov[Xi,Xj]=1n2{i=1nσ2+2i<j0}+x¯2Sxxσ2V[yi]=σ2,Cov[yi,yj]=0=1n2nσ2+x¯2Sxxσ2i=0nc=nc=(1n+x¯2Sxx)σ2

最小2乗推定量α^β^の共分散

Cov[α^,β^]=E[(α^E[α^])(β^E[β^])]Cov[X,Y]=E[(XE[X])(YE[Y])]=E[((y¯β^x¯)E[y¯β^x¯])(β^E[β^])]α=y¯β^x¯=E[(y¯SxySxxx¯E[y¯SxySxxx¯])(SxySxxE[SxySxx])]β^=SxySxx,Sxx=i=1n(xix¯)2,Sxy=i=1n(xix¯)(yiy¯)=E[(y¯SxySxxx¯E[y¯]+E[SxySxxx¯])(SxySxxE[SxySxx])]E[X±Y]=E[X]±E[Y]=E[(y¯SxySxxx¯E[y¯]+x¯SxxE[Sxy])(SxySxx1SxxE[Sxy])]E[cX]=cE[X]=E[{y¯E[y¯]x¯Sxx(SxyE[Sxy])}{1Sxx(SxyE[Sxy])}]=E[x¯Sxx(SxyE[Sxy])1Sxx(SxyE[Sxy])]y¯E[y¯]=y¯y¯=0=E[x¯Sxx2(SxyE[Sxy])2]=x¯Sxx2E[(SxyE[Sxy])2]E[cX]=cE[X]=x¯Sxx2σ2SxxE[(SxyE[Sxy])2]=V[Sxy]=σ2Sxx=x¯Sxxσ2

Cov[y¯,SxySxxx¯]=0について

Cov[y¯,SxySxxx¯]=E[(y¯E[y¯])(SxySxxx¯E[SxySxxx¯])]Cov[X,Y]=E[(XE[X])(YE[Y])]=E[(y¯y¯)(SxySxxx¯x¯SxxE[Sxy])]E[y¯]=y¯,E[cX]=cE[X]=E[0x¯Sxx(SxyE[Sxy])]=E[0]=0

単回帰における最小二乗推定量が不偏推定量であることの証明

線形推定量

以前に単回帰における最小2乗推定量(least squares estimator; LSE)を求めた際に利用したのは以下の式である.. {α^+x¯β^y¯=0nx¯α^+(i=1nxi2)β^(i=1nxiyi)=0(α^,β^) 上記は以下の形にでき,これは正規方程式(normal equation)と呼ばれる. {α^+x¯β^=y¯=(i=1n1nyi)nx¯α^+(i=1nxi2)β^=(i=1nxiyi) 観測値yiの一次式i=1nciyi(ci:)で表される推定量を線形推定量(linear estimator)と呼ぶ.
よってα^,β^yiの線形推定量である.

観測値yiの期待値

yi=α+βxi+ϵi(i=1,,n){ϵi|i=1,,n}:ϵiiidN(0,σ2)(independentandidenticallydistributed;IID,i.i.d.,iid)E[ϵi]=0,V[ϵi]=σ2,E[yi]=E[α+βxi+ϵi]=E[α]+E[βxi]+E[ϵi]=α+βxi+0E[C]=C(C:),E[ϵi]=0=α+βxi

最小二乗推定量β^が不偏推定量であることの証明

E[β^]=E[SxySxx]β^=SxySxx=E[i=1n(xix¯)(yiy¯)Sxx]Sxy=i=1n(xix¯)(yiy¯)=1SxxE[i=1n(xix¯)(yiy¯)]E[cX]=cE[X]=1Sxxi=1nE[(xix¯)(yiy¯)]E[i=1nAi]=E[Ai++Ai++An]=E[Ai]++E[Ai]++E[An]=i=1nE[Ai]E[X±Y]=E[X]±E[Y]=1Sxxi=1n(xix¯)E[yiy¯]E[cX]=cE[X]=1Sxxi=1n(xix¯)(E[yi]E[y¯])E[X±Y]=E[X]±E[Y]=1Sxxi=1n(xix¯){(α+βxi)(α+βx¯)}E[yi]=α+βxi,E[y¯]=α+βx¯=1Sxxi=1n(xix¯)(α+βxiαβx¯)=1Sxxi=1n(xix¯)β(xix¯)=1Sxxi=1n(xix¯)2β=1Sxxβi=1n(xix¯)2i=1ncXi=cX1++cXi++cXn=c(X1++Xi++Xn)=ci=1nXi=1SxxβSxxSxx=i=1n(xix¯)2=β

最小二乗推定量α^が不偏推定量であることの証明

E[α^]=E[y¯β^x¯]α^=y¯β^x¯=E[y¯]E[β^x¯]E[X±Y]=E[X]±E[Y]=E[y¯]x¯E[β^]E[cX]=cE[X]=α+βx¯βx¯E[y¯]=α+βx¯,E[β^]=β=α

標本平均の母平均まわりの4次モーメント (標本平均の4次の中心(化)モーメント)

標本平均Xの母平均μまわりの4次モーメント(=標本平均Xの4次の中心(化)モーメント)

E[(Xμ)4]=E[{(1nk=1nXk)μ}4]X=1ni=1nXi=E[{(1nk=1nXk)(1nk=1nμ)}4]C=nnC=1nCi=1n1=1ni=1nC(C:i)=E[[1n{(k=1nXk)(k=1nμ)}]4]=E[1n4{(k=1nXk)(k=1nμ)}4](AB)C=ACBC=E[1n4{k=1n(Xkμ)}4]i=1nXii=1nYi=i=1n(XiYi) 総和の指数計算において掛け合わせる添え字の組合せについて考える. (k=1nAk)4=(k=1nAk)(l=1nAl)(m=1nAm)(s=1nAs)=(A1+A2++Ak++An)(A1+A2++Al++An)(A1+A2++Am++An)(A1+A2++As++An)=4P0×(k=1nAk4)4(0)+4P1×(klAk3Al)3(1)+4C2×(k<lAk2Al2)22(2())+4P2×(kl,ml<mAk2AlAm)22(2())+4P3×(k<l<m<sAkAlAmAs)(3)(×)=4!(40)!(k=1nAk4)+4!(41)!(klAk3Al)+4!(42)!2!(k<lAk2Al2)+4!(42)!(kl,ml<mAk2AlAm)+4!(43)!(k<l<m<sAkAlAmAs)=4×3×2×14×3×2×1(k=1nAk4)+4×3×2×13×2×1(klAk3Al)+4×3×2×12×12×1(k<lAk2Al2)+4×3×2×12×1(kl,ml<mAk2AlAm)+4×3×2×11(k<l<m<sAkAlAmAs)=1(k=1nAk4)+4(klAk3Al)+6(k<lAk2Al2)+12(kl,ml<mAk2AlAm)+24(k<l<m<sAkAlAmAs) よって, E[(Xμ)4]=E[1n4{k=1n(Xkμ)}4]=E[1n4{k=1n(Xkμ)4+4kl(Xkμ)3(Xlμ)+6k<l(Xkμ)2(Xlμ)2+12kl,ml<m(Xkμ)2(Xlμ)(Xmμ)+24k<l<m<s(Xkμ)(Xlμ)(Xmμ)(Xsμ)}]=1n4E[k=1n(Xkμ)4+4kl(Xkμ)3(Xlμ)+6k<l(Xkμ)2(Xlμ)2+12kl,ml<m(Xkμ)2(Xlμ)(Xmμ)+24k<l<m<s(Xkμ)(Xlμ)(Xmμ)(Xsμ)]E[cX]=cE[X]=1n4[E[k=1n(Xkμ)4]+E[4kl(Xkμ)3(Xlμ)]+E[6k<l(Xkμ)2(Xlμ)2]+E[12kl,ml<m(Xkμ)2(Xlμ)(Xmμ)]+E[24k<l<m<s(Xkμ)(Xlμ)(Xmμ)(Xsμ)]]E[X+Y]=E[X]+E[Y]=1n4[E[k=1n(Xkμ)4]+4E[kl(Xkμ)3(Xlμ)]+6E[k<l(Xkμ)2(Xlμ)2]+12E[kl,ml<m(Xkμ)2(Xlμ)(Xmμ)]+24E[k<l<m<s(Xkμ)(Xlμ)(Xmμ)(Xsμ)]]E[cX]=cE[X]=1n4[k=1nE[(Xkμ)4]+4klE[(Xkμ)3(Xlμ)]+6k<lE[(Xkμ)2(Xlμ)2]+12kl,ml<mE[(Xkμ)2(Xlμ)(Xmμ)]+24k<l<m<sE[(Xkμ)(Xlμ)(Xmμ)(Xsμ)]]E[i=1nAi]=E[A1+A2++Ai++An]=E[A1]+E[A2]++E[Ai]++E[An]=i=1nE[Ai]=1n4[k=1nE[(Xkμ)4]+4klE[(Xkμ)3]E[(Xlμ)]+6k<lE[(Xkμ)2]E[(Xlμ)2]+12kl,ml<mE[(Xkμ)2]E[(Xlμ)]E[(Xmμ)]+24k<l<m<sE[(Xkμ)]E[(Xlμ)]E[(Xmμ)]E[(Xsμ)]]X,YE[XY]=E[X]E[Y] 1次の中心(化)モーメントについて考える. E[Xiμ]=E[Xi]E[μ]E[XY]=E[X]E[Y]=μμE[Xi]=E[X]=μ,E[C]=C(C)=0 これを用いて E[(Xμ)4]=1n4[k=1nE[(Xkμ)4]+4klE[(Xkμ)3]E[(Xlμ)]+6k<lE[(Xkμ)2]E[(Xlμ)2]+12kl,ml<mE[(Xkμ)2]E[(Xlμ)]E[(Xmμ)]+24k<l<m<sE[(Xkμ)]E[(Xlμ)]E[(Xmμ)]E[(Xsμ)]]=1n4[k=1nE[(Xkμ)4]+4kl(E[(Xkμ)3]0)+6k<lE[(Xkμ)2]E[(Xlμ)2]+12kl,ml<m(E[(Xkμ)2]00)+24k<l<m<s(0000)]E[Xiμ]=0=1n4[k=1nE[(Xkμ)4]+0+6k<lE[(Xkμ)2]E[(Xlμ)2]+0+0]=1n4{k=1nE[(Xkμ)4]+6k<lE[(Xkμ)2]E[(Xlμ)2]}=1n4{k=1nμ4+6k<l(σ2σ2)}E[(Xiμ)4]=μ4:4(),E[(Xiμ)2]=σ2:2()=1n4{k=1nμ4+6k<lσ4}=1n4{k=1nμ4+6σ4k<l1}=1n4{nμ4+6n(n1)2σ4}k<l1=n(n1)2(k=1n1l=k+1l=n)=1n3(μ4+3(n1)σ4)=μ4(X)μ4(X):Xμ4(4())

標本平均Xの母平均μまわりの4次モーメント(標本平均Xの4次の中心(化)モーメント)を尖度β2で表す

E[(Xμ)4]=μ4(X)=1n3(μ4+3(n1)σ4)=1n3(β2+3σ4+3(n1)σ4)μ4=β2+3σ4:4()=1n3(β2+3+3(n1)σ4)=1n3(β2+3+3n3σ4)=1n3(β2+3nσ4)

標本平均Xの尖度β2(X)

β2(X)=β2n

標本平均の分布の尖度

標本平均Xの尖度β2(X)

β2(X)=E[(Xμ)4]V[X]423β2=β2(X)=E[(Xμ)4]V[X]423=μ4σ43:=1n3(μ4+3(n1)σ4)(σ2n)23E[(Xμ)4]=1n3(μ4+3(n1)σ4):4(4())V[X]=σ2n:=n2n3μ4+3(n1)σ4σ43=1n(μ4σ4+3(n1))3=1n(μ4σ4+3n3)3=μ4σ43n+33=μ4σ43n=β2nβ2=μ4σ43 よって標本数nを増やすことでβ2(X)0に近づいていく.

母集団の尖度

母集団(平均 μ, 分散 σ2)の尖度β2

β2=E[(Xμ)4]V[X]423(,kurtosis)=μ4σ43μ4=E[(Xμ)3](Xμ4=X4())

確率変数Xの母平均μまわりの4次のモーメントμ4を尖度β2で表す

μ4=(β23)σ4

カイ二乗分布の期待値と分散

カイ二乗分布の期待値と分散

カイ二乗分布の期待値(一次モーメント)

E[x]=0xχ2(x)dx=0x12n2Γ(n2)ex2xn21dx=12n2Γ(n2)0xex2xn21dx=12n2Γ(n2)0ex2xn2dx=12n2Γ(n2)0ex2xn22n2(12)n2dx=12n2Γ(n2)2n20ex2xn2(12)n2dx=1Γ(n2)0ex2(x2)n2dx=1Γ(n2)0ettn22dtt=x2,dtdx=12,dx=2dt=1Γ(n2)20ettn2dtcf(x)dx=cf(x)dx=1Γ(n2)20ettn2+11dt=1Γ(n2)2Γ(n2+1)Γ(s)=0etts1dt=1Γ(n2)2n2Γ(n2)Γ(s+1)=0ettsdt=sΓ(s)=n

カイ二乗分布の二次モーメント

E[x2]=0x2χ2(x)dx=0x212n2Γ(n2)ex2xn21dx=12n2Γ(n2)0x2ex2xn21dx=12n2Γ(n2)0ex2xn2+1dx=12n2Γ(n2)0ex2xn2+12n2+1(12)n2+1dx=12n2Γ(n2)2n2+10ex2xn2+1(12)n2+1dx=12n2Γ(n2)2n220ex2xn2+1(12)n2+1dx=12n2Γ(n2)2n220ex2xn2+1(12)n2+1dx=2Γ(n2)0ex2(x2)n2+1dx=2Γ(n2)0ettn2+12dtt=x2,dtdx=12,dx=2dt=2Γ(n2)20ettn2+1dtcf(x)dx=cf(x)dx=2Γ(n2)20ettn2+1+11dt=2Γ(n2)20ettn2+21dt=2Γ(n2)2Γ(n2+2)Γ(s)=0etts1dt=2Γ(n2)2(n2+1)n2Γ(n2)Γ(s+2)=(s+1)Γ(s+1)=(s+1)sΓ(s)=2n(n2+1)=n(n+2)

カイ二乗分布の分散(二次の中心モーメント)

V[x2]=E[(xE[x])2]=E[x2]E[x]2=n(n+2)n2=n2+2nn2=2n

Γ(s+1)=sΓ(s)

Γ(s+1)=sΓ(s)

Γ(s+1)=0etts+11dtΓ(s)=0etts1dt=0ettsdt=0{et}tsdtddt(et)={et}=et=[etts]00{et}{sts1}dtfgdx=fgfgdx=[(limttset)(0se0)]+s0etts1dtcf(x)dx=cf(x)dx=[00]+s0etts1dtlimttset=0=sΓ(s)Γ(s)=0etts1dt

Γ(s+2)=(s+1)sΓ(s)

Γ(s+2)=(s+1)Γ(s+1)=(s+1)sΓ(s)

(x^n)/(e^x)の極限

(x^n)/(e^x)の極限

以下を証明する limxxnex=0 まずexのマクローリン展開からexより小さい値を考える. ex=k=0xkk!=k=0fk(x)fk(x)=xkk!>xn+1(n+1)!fkexfk(k=n+1) 上記値の逆数をとる. 1ex<(n+1)!xn+1 両辺にx^nを掛け,証明したい式の形にする. xn1ex<xn(n+1)!xn+1xn<(n+1)!xxnxn+1=1x 両辺の極限をとることでxnexの極限の値が0より小さいことがわかる. limxxnex<limx(n+1)!x=0 また,0xにおいて0xn及び0<exとなるのでxnexが0以上であることがわかる.
以上から次の関係(不等式)を得る. 0limxxnex<limx(n+1)!x=0 これより“はさみうちの原理”から極限の値が0であることが証明された. limxxnex=0

定積分を用いた凾数同士の被積分凾数

定積分を用いた凾数同士の被積分凾数

F(x)=axf(t)dtG(x)=axg(t)dt,axb とする.今,任意のxにおいて(xの取りえる範囲すべてのxにおいて) F(x)=G(x) が成り立つなら(特定の積分範囲の定積分結果が等しいだけではないところに注意), F(x)=G(x) つまり f(x)=g(x) が成り立つ.
よって axf(t)dt=axg(t)dt ならば f(x)=g(x) であり,被積分凾数同士も等しい.

カイ二乗分布の導出

カイ二乗χ2分布の導出

k=1のXの確率密度凾数

X=Z12Z1:F1(X=t)=0tf1(x)dxk=1XF1,f1F1(X=t)=t+tg(z1)dz1Z1=±X,x:0t,z1:0±tg=20tg(z1)dz1(y(x0)),Z10=20tg(x)12x12dxZ1=X(Z10)dz1dx=ddxx=ddxx12=12x12,dz1=12x12dxz1:0t,x:0t=0tg(x)x12dx0tf1(x)dx=0tg(x)x12dx(0t(>0))f1(x)=g(x)x120t(>0)0tt=12πex22x12:g(x)=12πex22=12πex2x12

k=2のXの確率密度凾数

k=2 X=Z12+Z22Z1,Z2:Y=Z12XY=Z22f2(x)=0f1(y)f1(xy)dyk=2Xf2,Z1Z2f1(Z1)f1(Z2)=0x{12πey2y12}{12πe(xy)2(xy)12}dy=12π12π0xey2e(xy)2y12(xy)12dy=12π0xey2(xy)2y12(xy)12dy=12πex20xy12(xy)12dy=12πex2π0a1xaxdx=π=12ex2

k=3のXの確率密度凾数

X=Z12+Z22+Z32Z1,Z2,Z3:Y=Z12+Z22XY=Z32f3(x)=0f2(y)f1(xy)dyk=3Xf3,YZ3f2(Y)f1(Z3)=0x{12ey2}{12πe(xy)2(xy)12}dy=1212π0xey2e(xy)2(xy)12dy=122π0xey2(xy)2(xy)12dy=122πex20x(xy)12dy=122πex22x120a1axdx=2a12=12πex2x12

k=4のXの確率密度凾数

X=Z12+Z22+Z32+Z42Z1,Z2,Z3,Z4:Y=Z12+Z22+Z32XY=Z42f4(x)=0f3(y)f1(xy)dyk=4Xf4,YZ4f3(Y)f1(Z4)=0x{12πey2y12}{12πe(xy)2(xy)12}dy=12π12π0xey2e(xy)2y12(xy)12dy=12π0xey2(xy)2y12(xy)12dy=12πex20xy12(xy)12dy=12πex2xπ20axaxdx=aπ2=14ex2x

k=5のXの確率密度凾数

X=Z12+Z22+Z32+Z42+Z52Z1,Z2,Z3,Z4,Z5:Y=Z12+Z22+Z32+Z42XY=Z52f5(x)=0f4(y)f1(xy)dyk=5Xf5,YZ4f4(Y)f1(Z5)=0x{14ey2y}{12πe(xy)2(xy)12}dy=1412π0xey2e(xy)2y(xy)12dy=142π0xey2(xy)2y(xy)12dy=142πex20xy(xy)12dy=142πex243x320axaxdx=43a32=132πex2x32

k=nXの確率密度凾数の類推

k=1:f1(x)=12πex2x12k=2:f2(x)=12ex2x0k=3:f3(x)=12πex2x12k=4:f4(x)=14ex2x1k=5:f5(x)=132πex2x32k=n:fn(x)=αnex2xn21

係数αnを求める

Fn(t)=0tfn(x)dxnXFn,fnFn(t)=0tαnex2xn21dx=αn0tex2xn21dxαnx,cf(x)dx=cf(x)dx=αn0tet(2u)n212duu=x2,x=2u,dxdu=2,x:0,u:0=αn0tet2n21tn212dt=αn0tet2n2tn21dt=αn2n20tettn21dtFn(t=)=0fn(x)dx=αn2n20ettn21dt=αn2n2Γ(n2)Γ(s)=0etts1dt=αn2n2Γ(n2)=11αn=Fn(t=)2n2Γ(n2)=12n2Γ(n2)

係数αkの確認

α1=1212Γ(12)=1212π=12πα2=1222Γ(22)=1211=12α3=1232Γ(32)=1232π2=12πα4=1242Γ(42)=1221=14α5=1252Γ(52)=12523π4=132π

累積分布凾数の等式よりk=nXの確率密度凾数を求める

0tfn(x)dx=0t12n2Γ(n2)ex2xn21dx(0t(>0))fn(x)=12n2Γ(n2)ex2xn210t(>0)0tt

数学的帰納法による証明

f1(x),fn(x)を認めた上で,fn+1(x)fn(x)nn+1とした式になるかを確認する. f1(x)=12πex2x12fn(x)=12n2Γ(n2)ex2xn21fn+1(x)=12n+12Γ(n+12)ex2xn+121fn(x)nn+1,2 X=Z12++Zn2+Zn+12Z1,,Zn,Zn+1:Y=Z12++ZnXY=Zn+12fn+1(x)=0fn(y)f1(xy)dy=0{12n2Γ(n2)ey2yn21}{12πexy2(xy)12}dy=12n2Γ(n2)12π0ey2exy2yn21(xy)12dycf(x)dx=cf(x)dx=12n2Γ(n2)12π0ey2xy2yn21(xy)12dyABAC=AB+C=12n2Γ(n2)1212π0ex2yn21(xy)12dy=12n2212Γ(n2)1πex20yn21(xy)12dycf(x)dx=cf(x)dx=12n+12Γ(n2)1πex201(xu)n21(xxu)12xduy=xu,dydu=x,x:0,u:01=12n+12Γ(n2)1πex201(xu)n21{x(1u)}12xdu=12n+12Γ(n2)1πex201xn21un21x12(1u)12xdu(AB)C=ACBC=12n+12Γ(n2)1πex2xn21x12x01un21(1u)12ducf(x)dx=cf(x)dx=12n+12Γ(n2)1πex2xn2112+101un21(1u)12duABAC=AB+C=12n+12Γ(n2)1πex2xn+12101un21(1u)12du=12n+12Γ(n2)1πex2xn+121B(n21,12)B(p,q)=01xp(1x)qdx=12n+12Γ(n2)1πex2xn+121(n21)!(12)!(n2112+1)!B(p,q)=p!q!(p+q+1)!=12n+12Γ(n2)1πex2xn+121(n21)!(12+11)!(n2+121)!=12n+12Γ(n2)1πex2xn+121(n21)!(121)!(n+121)!=12n+12Γ(n2)1πex2xn+121Γ(n2)Γ(12)Γ(n+12)Γ(n)=(n1)!=12n+12Γ(n2)1πex2xn+121Γ(n2)Γ(12)Γ(n+12)=12n+121πex2xn+121Γ(12)Γ(n+12)=12n+121πex2xn+121πΓ(n+12)Γ(12)=π=12n+12Γ(n+12)ex2xn+121 任意のn(n1)において上記式が成り立つことを証明できた.
以上によりχ2分布の確率密度凾数が導出された.

x/√(a-x)の積分

x/√(a-x)の積分

不定積分

xaxdx=x(ax)12dx=x{2(ax)12}dx(ax)12dx=2(ax)12+C=2x(ax)122(ax)12dxf(x)g(x)dx=fgfgdx=2x(ax)12+2(ax)12dx=2x(ax)12+2{112+1(ax)12+1(1)}=2x(ax)12+2{132(ax)32}=2x(ax)12+2{23(ax)32}=2x(ax)1243(ax)32=2x(ax)1243(ax)(ax)12=(ax)12{2x43(ax)}=(ax)12(2x43a+43x)=(ax)12(63x43a+43x)=(ax)12(23x43a)=23(ax)12(x+2a)+CC:=23ax(x+2a)+C

定積分

0axaxdx=[23ax(x+2a)]0a=(23aa(a+2a))(23a0(0+2a))=0(23a(2a))=0(43a3)=43a32

√(x)/√(a-x)の積分

√(x)/√(a-x)の積分

不定積分

xaxdx=x12(ax)12dx=u(au2)122uduu=x,dudx=12x,dx=2xdu=2udu=2u2(au2)12ducf(x)dx=cf(x)dx=2{asin(θ)}2[a{asin(θ)}2]12acos(θ)dθu=asin(θ),dudθ=acos(θ),du=acos(θ)dθ=2asin2(θ){aasin2(θ)}12acos(θ)dθ=2aasin2(θ)[a{1sin2(θ)}]12cos(θ)dθ=2aaasin2(θ)a12{1sin2(θ)}12cos(θ)dθ=2aaa12sin2(θ){1sin2(θ)}12cos(θ)dθ=2asin2(θ){1sin2(θ)}12cos(θ)dθ=2asin2(θ){cos2(θ)}12cos(θ)dθ=2asin2(θ){cos(θ)}1cos(θ)dθ=2asin2(θ)dθ=2a{12θ12sin(θ)cos(θ)}sin2(θ)dθ=12{θsin(θ)cos(θ)}+C(C:)=2a{12sin1(ua)12sin(sin1(ua))cos(sin1(ua))}u=asin(θ),ua=sin(θ),θ=sin1(ua)=2a{12sin1(ua)12(ua)1(ua)2}sin(sin1(x))=x,cos(sin1(x))=1x2=2a12{sin1(ua)(ua)1(ua)2}=a{sin1(ua)(ua)1(ua)2}=a{sin1(xa)(xa)1(xa)2}u=x=a{sin1(xa)xa1xa}=a{sin1(xa)xaaxa}=a{sin1(xa)xaaxa}AB=(AB)12=(A1B)12=A12(1B)12=A12(B1)12=A12B12=A1B=AB=a{sin1(xa)xaxa}=asin1(xa)axaxa=asin1(xa)xax+CC:=asin1((xa)12)x12(ax)12+C

定積分

0axaxdx=[asin1((xa)12)x12(ax)12]0a=(asin1((aa)12)a12(aa)12)(asin1((0a)12)012(a0)12)=(asin1(1)0)(00)sin1(0)=0,0A=0=aπ2sin1(1)=π2=aπ2

1/√(a-x)の積分

1/√(a-x)の積分

不定積分

1axdx=(ax)12dx=u12(1)duu=ax,dudx=1,dx=du=u12ducf(x)dx=cf(x)dx=112+1u12+1xadx=1a+1xa+1+C(C:)=112u12=2u12=2(ax)12u=ax=2(ax)12+CC:=2ax+C

定積分

0a1axdx=[2ax]0a=(2aa)(2a0)=0(2a)=2a=2a12

1/√(x(a-x))の積分

1/√(x(a-x))の積分

不定積分

1x(ax)dx={x(ax)}12dx=x12(ax)12dx=u1(au2)122uduu=x,dudx=12x,dx=2xdu=2udu=2(au2)12duu1u=1,cf(x)dx=cf(x)dx=2[a{asin(θ)}2]12acos(θ)dθu=asin(θ),dudθ=acos(θ),du=acos(θ)dθ=2a[a{a2sin2(θ)}]12cos(θ)dθ(AB)C=ACBC=2a{aasin2(θ)}12cos(θ)dθ=2a[a{1sin2(θ)}]12cos(θ)dθ=2aa12{1sin2(θ)}12cos(θ)dθ=2aaa12{1sin2(θ)}12cos(θ)dθ=2{1sin2(θ)}12cos(θ)dθAA12=A12A12=A12+12=A0=1=2{cos2(θ)}12cos(θ)dθcos2(θ)+sin2(θ)=1,cos2(θ)=1sin2(θ)=2{cos(θ)}2(12)cos(θ)dθ(AB)C=ABC=2{cos(θ)}1cos(θ)dθ=2dθA1A=1=2θdx=x+C(C:)=2sin1(ua)θ=sin1(ua)=2sin1(xa)u=x=2sin1(xa)+CC:

定積分

0a1x(ax)dx=[2sin1(xa)]0a={2sin1(aa)}{2sin1(0a)}={2sin1(1)}{2sin1(0)}=(2π2)(20)=π0=π

sinの二乗の不定積分

sinの二乗の不定積分

sin2(θ)dθ=1212cos(2θ)dθcos(2θ)=cos2(θ)sin2(θ)=(1sin2(θ))sin2(θ)=12sin2(θ)sin2(θ)=1212cos(2θ)=12dθ12cos(2θ)dθ=12θ12cos(2θ)dθ=12θ12cos(ϕ)12dϕϕ=2θ,dϕdθ=2,dθ=12dϕ=12θ14cos(ϕ)dϕcf(x)dx=cf(x)dx=12θ12(12sin(ϕ))cos(x)dx=sin(x)+C(C:)=12θ14sin(ϕ)=12θ14sin(2θ)=12θ12sin(θ)cos(θ)=12{θsin(θ)cos(θ)}+CC:

ベータ分布の期待値(平均)と分散

f(x;m,n)=x(m1)(1x)(n1)B(m,n)B(m,n)=01x(m1)(1x)(n1)dx=(m1)!(n1)!{(m1)+(n1)+1}!αβ(xα)p(βx)qdx=p!q!(p+q+1)!(βα)(p+q+1)()=(m1)!(n1)!(m+n1)!

ベータ分布の期待値(一次モーメント・平均)

E[X]=01xf(x)dx=01xx(m1)(1x)(n1)B(m,n)dx=1B(m,n)01xm(1x)(n1)dx=(m+n1)!(m1)!(n1)!m!(n1)!(m+n)!=(m+n1)!(m+n)!m!(m1)!=1m+nm1=mm+n

ベータ分布の二次モーメント

E[X2]=01x2f(x)dx=01x2x(m1)(1x)(n1)B(m,n)dx=1B(m,n)01x(m+1)(1x)(n1)dx=(m+n1)!(m1)!(n1)!(m+1)!(n1)!((m+1)+n)!=(m+n1)!(m1)!(n1)!(m+1)!(n1)!(m+n+1)!=(m+n1)!(m+n+1)!(m+1)!(m1)!=1(m+n+1)(m+n)(m+1)m1=(m+1)m(m+n+1)(m+n)

ベータ分布の分散(二次の中心モーメント

V[X]=E[X2]E[X]2=(m+1)m(m+n+1)(m+n){mm+n}2=(m+1)m(m+n+1)(m+n)m2(m+n)2=(m+n)(m+1)m(m+n+1)m2(m+n+1)(m+n)2=(m2+m+mn+n)m(m3+m2n+m2)(m+n+1)(m+n)2=m3+m2+m2n+mnm3m2nm2(m+n+1)(m+n)2=mn(m+n+1)(m+n)2

KLダイバージェンスの下限(イェンセンの不等式による)

KLダイバージェンスの下限(イェンセンの不等式による)

pi:P(X)xiqi:Q(X)xi(Q:P) DKL(P||Q)=i=1kpilog(piqi)=i=1kpi{log(qipi)}log(AB)=log((BA)1)=log(BA)log(i=1kpiqipi)log(x)()()i=1nϕif(xi)f(i=1nϕixi)(())DKL(P||Q)log(i=1kpiqipi)log(i=1kqi)log(1)qii=1kqi=10

log(x)の凸凾数の判定

d2dx2{log(x)}=d2dx2{log(x)}{cf(x)}=c{f(x)}=ddx{1x}{log(x)}=x1=1x=(1x2)(x1)=x2=1x2=1x2>0x,() 

logex(x1)の関係を用いたKLダイバージェンスの下限

イェンセンの不等式の証明

イェンセンの不等式

ϕ1,ϕ2,ϕn0<ϕiかつi=1nϕi=1を満たしまた,x1,x2,xnを実数の列とするとき,凸凾数f(x)に対して以下のことが成り立つ. i=1nϕif(xi)f(i=1nϕixi)f(x)().(i=1nϕif(xi)f(i=1nϕixi)f(x)().)

凸凾数(下に凸の凾数)

凸凾数(下に凸の凾数)の性質

任意のx1,x2に対して凸凾数(下に凸の凾数)f(x)では,(x1,f(x1)),(x2,f(x2))を結ぶ線分g(x)は凾数f(x)の上側にある.
逆に,(x1,f(x1)),(x2,f(x2))を結ぶ線分g(x)が凾数f(x)の上側にあるので,f(x)は凸凾数(下に凸の凾数)である. 

凸凾数(下に凸の凾数)にかかる線分g(x)の式

xt=(1t)x1+tx2(0t1)x1x2x1tx.=i=12ϕixiϕi={1t,t}0ϕii=12ϕi=1g(x)f(x1)=f(x2)f(x1)x2x1(xx1)f(x2)f(x1)x2x1(x1,f(x1))g(x)=f(x2)f(x1)x2x1(xx1)+f(x1)=f(x2)f(x1)x2x1(xtx1)+f(x1)xtxt=f(x2)f(x1)x2x1{(1t)x1+tx2x1}+f(x1)xt=(1t)x1+tx2=f(x2)f(x1)x2x1(x1tx1+tx2x1)+f(x1)=f(x2)f(x1)x2x1(tx1+tx2)+f(x1)=f(x2)f(x1)x2x1t(x2x1)+f(x1)={f(x2)f(x1)}t+f(x1)=tf(x2)tf(x1)+f(x1)=tf(x2)+(1t)f(x1)=(1t)f(x1)+tf(x2)=i=12ϕif(xi)ϕi={1t,t}0ϕii=12ϕi=1

数学的帰納法によるイェンセンの不等式の証明

n=2の証明

g(xt)f(xt)()g(x)f(x).(1t)f(x1)+tf(x2)f((1t)x1+tx2)xt=(1t)x1+tx2i=12ϕif(xi)f(i=12ϕixi)n=2.

n=kを認める状況でn=k+1を証明

n=k+1の式を変形していく. i=1k+1θif(xi)=i=1kθif(xi)+θk+1f(xk+1)0θii=1k+1θi=1=Θki=1kθiΘkf(xi)+θk+1f(xk+1)Θk=i=1kθi=1θk+1<1,i=1kθiΘk=1Θki=1kθi=1Θkf(i=1kθiΘkxi)+θk+1f(xk+1)n=k(i=1kϕif(xi)f(i=1kϕixi)),i=1kθiΘkf(xi)f(i=1kθiΘkxi).

n=2の式としてみる. Θkf(i=1kθiΘkxi)+θk+1f(xk+1)=λ1f(a1)+λ2f(a2)λj={Θk,θk+1},aj={i=1kθiΘkxi,xk+1}=j=12λjf(aj)f(j=12λjaj)n=2.

j=12λjajを変形していく. j=12λjaj=Θki=1kθiΘkxi+θk+1xk+1=Θk1Θki=1kθixi+θk+1xk+1i=1nCxi=Ci=1nxi=i=1kθixi+θk+1xk+1=i=1k+1θixi

変形結果を戻す.

f(j=12λjaj)=f(i=1k+1θixi)

以上よりn=kを認めればn=k+1でもイェンセンの不等式が成り立つ. i=1k+1θif(xi)f(i=1k+1θixi)

n=2及びn=k+1の証明からの結論

数学的帰納法によりイェンセンの不等式が成り立つ.