間違いしかありません.コメントにてご指摘いただければ幸いです(気が付いた点を特に断りなく頻繁に書き直していますのでご注意ください).

四元数において,可逆元とその逆元を左右から作用させる

qpq1

qpq1=qpq|q|2=1|q|2qpq=1w2+|V|2(w,V)(wp,Vp)(w,V)q=wxiyjzk=(w,V),(,ijk),V=xi+yj+zk=1w2+|V|2(wwpVVp,wVp+wpV+V×Vp)(w,V)q1q2=(w1,V1)(w2,V2)=(w1w2V1V2,w1V2+w2V1+V1×V2)=1w2+|V|2((wwpVVp)w(wVp+wpV+V×Vp)(V),(wwpVVp)(V)+w(wVp+wpV+V×Vp)+(wVp+wpV+V×Vp)×(V))q1q2=(w1,V1)(w2,V2)=(w1w2V1V2,w1V2+w2V1+V1×V2)=1w2+|V|2(w2wpwVVp+wVpV+wpVV+(V×Vp)V),wwpV+(VVp)V+w2Vp+wwpV+wV×Vp+V×(wVp+wpV+V×Vp))A×B=B×A=1w2+|V|2(w2wp+wp|V|2+(V×V)Vp,+(VVp)V+w2Vp+wV×Vp+wV×Vp+wpV×V+V×(V×Vp))(A×B)C=(B×C)A=(C×A)B,A×A=0,AA=|A|2=1w2+|V|2(wp(w2+|V|2),(VVp)V+w2Vp+2wV×Vp+(VVp)V(VV)Vp)A×(B×C)=(AC)B(AB)C=1w2+|V|2(wp(w2+|V|2),2(VVp)V+w2Vp+2wV×Vp|V|2Vp)AA=|A|2=1w2+|V|2(wp(w2+|V|2),2(VVp)V+(w2|V|2)Vp+2wV×Vp)

特殊なp, qを考える

ここで,q=(cos(θ2),sin(θ2)V)(|V|=1),p=(0,Vp)とする. qpq1=1cos2(θ2)+|sin(θ2)V|2(0(cos2(θ2)+|sin(θ2)V|2),2(sin(θ2)VVp)sin(θ2)V+(cos2(θ2)|sin(θ2)V|2)Vp+2cos(θ2)sin(θ2)V×Vp)=1cos2(θ2)+sin(θ2)|V|2(0,2sin2(θ2)(VVp)V+(cos2(θ2)sin2(θ2)|V|2)Vp+2cos(θ2)sin(θ2)V×Vp)=1cos2(θ2)+sin(θ2)1(0,2sin2(θ2)(VVp)V+(cos2(θ2)sin2(θ2)1)Vp+2cos(θ2)sin(θ2)V×Vp)=11(0,2sin2(θ2)(VVp)V+(cos2(θ2)sin2(θ2))Vp+2cos(θ2)sin(θ2)V×Vp)=(0,(1cos(θ))(VVp)V+cos(θ)Vp+sin(θ)V×Vp)2sin2(θ2)=sin2(θ2)+sin2(θ2)=(1cos2(θ2))+sin2(θ2)=1(cos2(θ2)sin2(θ2))=1cos(θ)cos2(θ2)sin2(θ2)=cos(θ2+θ2)=cos(θ)2cos(θ2)sin(θ2)=sin(θ2+θ2)=sin(θ)=(0,(VVp)Vcos(θ)(VVp)V+cos(θ)Vp+sin(θ)V×Vp)=(0,(VVp)V+cos(θ)(Vp(VVp)V)+sin(θ)V×Vp) 位置ベクトルVpを任意の回転軸V周りでθだけ回転させる計算に対応する.

四元数の逆元

qq, q1

qq=(w,V)(w,V)q=wxiyjzk=(w,V),(,ijk),V=xi+yj+zk=(wwV(V),w(V)+wV+V×(V))q1q2=(w1,V1)(w2,V2)=(w1w2V1V2,w1V2+w2V1+V1×V2)=(w2+|V|2,0)AA=|A|2,A×A=0 |q|2=qq=qq=w2+|V|2 qq|q|2=qq|q|2=qq|q|2=q|q|2q=1 q1=q|q|2AB=BA=E()BA1()

qq1

qq1=qq|q|2=1|q|2qq=1w2+|V|2(w,V)(w,V)=1w2+|V|2(w2+|V|2,w(V)+wV+V×V)=1w2+|V|2(w2+|V|2,0)=(w2+|V|2w2+|V|2,w2+|V|2w2+|V|2)=(1,0)()

四元数(quaternion)の掛け算

四元数(quaternion)

q=w+xi+yj+zk=(w,V)(,ijk),V=xi+yj+zkq=(w+xi+yj+zk)=wxiyjzk=(w,V)q=wxiyjzk=(w,V)

q1q2

q1=w1+x1i+y1j+z1k=(w1,V1)q2=w2+x2i+y2j+z2k=(w2,V2)q1q2=(w1,V1)(w2,V2)=(w1+x1i+y1j+z1k)(w2+x2i+y2j+z2k)=w1w2+w1x2i+w1y2j+w1z2k+x1iw2+x1ix2i+x1iy2j+x1iz2k+y1jw2+y1jx2i+y1jy2j+y1jz2k+z1kw2+z1kx2i+z1ky2j+z1kz2k=w1w2+w1x2i+w1y2j+w1z2k+x1w2i+x1x2i2+x1y2ij+x1z2ik+y1w2j+y1x2ji+y1y2j2+y1z2jk+z1w2k+z1x2ki+z1y2kj+z1z2k2=w1w2+w1x2i+w1y2j+w1z2k+x1w2i+x1x2(1)+x1y2(k)+x1z2(j)+y1w2j+y1x2(k)+y1y2(1)+y1z2(i)+z1w2k+z1x2(j)+z1y2(i)+z1z2(1)i2=j2=k2=1,ij=ji=k,ki=ik=j,jk=kj=i=(w1w2x1x2y1y2z1z2)+(w1x2+x1w2+y1z2z1y2)i+(w1y2x1z2+y1w2+z1x2)j+(w1z2+x1y2y1x2+z1w2)k=(w1w2x1x2y1y2z1z2)+(w1x2+x1w2+y1z2z1y2)i+(w1y2+y1w2x1z2+z1x2)j+(w1z2+z1w2+x1y2y1x2)k=(w1w2V1V2,w1V2+w2V1+V1×V2)

位置ベクトルを任意の回転軸周りで回転させる計算

Pの位置ベクトルVpを任意の回転軸(単位ベクトルV)周りでθだけ回転させる変換

OOP:PVp:V(|V|=1):θOP:PVθPO:PV(P)V(PV) OO=(VVp)V(|V||Vp|cos(ϕ))V=(|Vp|cos(ϕ))VϕVVp(=OP)OOOPOP=OPOO(OP=OO+OP)(|OP|cos(θ))OP|OP|=cos(θ)OPOPOP=cos(θ)(OPOO)=cos(θ)(Vp(VVp)V)V×Vp:VVpOOOP|V||Vp|sin(ϕ)=|Vp|sin(ϕ)=|OP|=|OP|(|OP|cos(π2θ))V×Vp|V×Vp|=(|OP|sin(θ))V×Vp|OP|OPV×Vpcos(π2θ)=cos(π2)cos(θ)sin(π2)sin(θ)=0cos(θ)1sin(θ)=sin(θ)=sin(θ)V×VpOP=OO+OP=OO+cos(θ)OP+sin(θ)V×Vp=(VVp)V+cos(θ)(Vp(VVp)V)+sin(θ)V×Vp これは四元数において,元と逆元を左右から作用させる際の特殊な形と同様の計算となる.

1/6, 1/12, 1/30 公式

16公式

x(xα)(xβ)()は 二次凾数の解(x軸との交点)をx=α,βとした,p=1,q=1の第一種オイラー積分である.
(X軸の下側にできる面積は負値で表される) αβ(xα)(xβ)dx=αβ(xα)1(1(βx))1dx=1!1!(1+1+1)!(βα)(1+1+1)αβ(xα)p(βx)qdx=p!q!(p+q+1)!(βα)(p+q+1)=1!1!3!(βα)3=16(βα)3 ( 積分として解いた記事 )




112公式

x軸とそれと接する三次凾数(xα)(xβ)2で囲まれる面積は三次凾数の解をx=α,β(後者を重複側とする)とした, p=1,q=2の第一種オイラー積分である. αβ(xα)(xβ)2dx=αβ(xα)1(1(βx))2dx=1!2!(1+2+1)!(βα)(1+2+1)αβ(xα)p(βx)qdx=p!q!(p+q+1)!(βα)(p+q+1)=1!2!4!(βα)4=224(βα)4=112(βα)4



130公式

x軸とそれと接する四次凾数(xα)2(xβ)2で囲まれる面積は四次凾数の解をx=α,β(両方を重複とする)とした, p=2,q=2の第一種オイラー積分である. αβ(xα)2(xβ)2dx=αβ(xα)2(1(βx))2dx=2!2!(2+2+1)!(βα)(2+2+1)αβ(xα)p(βx)qdx=p!q!(p+q+1)!(βα)(p+q+1)=2!2!5!(βα)5=4120(βα)5=130(βα)5



13公式(?)

x軸と接する二次凾数(xα)2があり,それらとx=βで囲まれる面積は二次凾数の解をx=α(重複)とした, p=2,q=0の第一種オイラー積分である. αβ(xα)2(xβ)0dx=αβ(xα)2(1(βx))0dx=2!0!(2+0+1)!(βα)(2+0+1)αβ(xα)p(βx)qdx=p!q!(p+q+1)!(βα)(p+q+1)=2!0!3!(βα)3=26(βα)3=13(βα)3 これは(xα)2αからβまでの積分結果と同様になっている. αβ(xα)2dx=[13(xα)3]αβ=[13(βα)313(αα)3]=[13(βα)30]=13(βα)3

第一種オイラー積分 / ベータ凾数

第一種オイラー積分 / ベータ凾数

p,q0の整数の元で以下の式を第一種オイラー積分という. αβ(xα)p(βx)qdx 部分積分を一回適用すると以下のようにp+1,q1の第一種オイラー積分がでてくる. αβ(xα)p(βx)qdx=αβ[ddx{1p+1(xα)(p+1)}](βx)qdxddx{1p+1(xα)(p+1)}=(xα)p=[1p+1(xα)(p+1)(βx)q]αβαβ1p+1(xα)(p+1){q(βx)(q1)(1)}dxfgdx=fgfgdx=0αβqp+1(xα)(p+1)(βx)(q1)dx(αα)=0,(ββ)=0=qp+1αβ(xα)(p+1)(βx)(q1)dx 第一種オイラー積分の乗数p,qに着目し元の式をIp,q,部分積分によって出てきた積分をIp+1,q1と表すと以下の様になる. Ip,q=qp+1Ip+1,q1Ia,b=αβ(xα)a(βx)bdx=qp+1q1p+2Ip+2,q2=qp+1q1p+22p+(q1)1p+qIp+q,0Ip+q,0=αβ(xα)(p+q)(βx)0dx=αβ(xα)(p+q)dx=[1p+q+1(xα){(p+q)+1}]αβ=1p+q+1(βα)(p+q+1)=(βα)(p+q+1)p+q+1Ip,q=qp+1q1p+22p+q11p+q(βα)(p+q+1)p+q+1=q(q1)21(p+1)(p+2)(p+q1)(p+q)(p+q+1)(βα)(p+q+1)=q!(p+q+1)!p!(βα)(p+q+1)=p!q!(p+q+1)!(βα)(p+q+1) 特にα=0,β=1の時 αβ(xα)p(βx)qdx=01(x0)p(1x)qdx=01xp(1x)qdx=p!q!(p+q+1)!(10)(p+q+1)αβ(xα)p(βx)qdx=p!q!(p+q+1)!(βα)(p+q+1)=p!q!(p+q+1)! 特にα=0,β=1,p=m1,q=n1の時 αβ(xα)p(βx)qdx=01x(m1)(1x)(n1)dx=(m1)!(n1)!((m1)+(n1)+1)!01xp(1x)qdx=p!q!(p+q+1)!=(m1)!(n1)!(m+n1)!=Γ(m)Γ(n)Γ(m+n)Γ(a)=(a1)!=B(m,n) 逆を言えば上記積分の値を1にしたい時はベータ凾数で割れば(逆数を掛ければ)よい(確率密度凾数との関係性). 1B(m,n)01x(m1)(1x)(n1)dx=1f(x;m,n)=x(m1)(1x)(n1)B(m,n)

n回の事象が発生するまでの間隔の確率密度分布 (ガンマ分布)

n回の事象が発生するまでの間隔(時間)の確率Ynについて考える. Fn(t)=P(Ynt)FnYn(cumulativedistributionfunction,CDF)(tn)=P(Xtn)nt=x=nPo(x;λt)λt:Po(x;λ)=eλ(λ)xx!=x=neλt(λt)xx!()=1x=0n1eλt(λt)xx!tn=1eλt{(λt)00!+(λt)11!+(λt)22!++(λt)(n2)(n2)!+(λt)(n1)(n1)!}=1eλtAA={(λt)00!+(λt)11!+(λt)22!++(λt)(n2)(n2)!+(λt)(n1)(n1)!}Yn=Fn(t)t=0[(eλt)A+eλt(A)](fg)=fg+fg(probabilitydensityfunctionPDF)(eλt)A=eλt(λ)A=eλt(λ){(λt)00!+(λt)11!+(λt)22!++(λt)(n2)(n2)!+(λt)(n1)(n1)!}=eλt{λ0!λ2t1!λ3t22!λ(n1)t(n2)(n2)!λnt(n1)(n1)!}eλt(A)=eλt({(λt)00!+(λt)11!+(λt)22!++(λt)(n2)(n2)!+(λt)(n1)(n1)!})=eλt{(10!)+(λt1!)+(λ2t22!)++(λ(n2)t(n2)(n2)!)+(λ(n1)t(n1)(n1)!)}=eλt{0+λ1!+2λ2t2!++(n2)λ(n2)t(n3)(n2)!+(n1)λ(n1)t(n2)(n1)!}=eλt{λ1!+λ2t1!++λ(n2)t(n3)(n3)!+λ(n1)t(n2)(n2)!}nn!=nn×(n1)××1=1(n1)××1=1(n1)!(eλt)A+eλt(A)=eλt{λ10!λ2t1!λ3t22!λ(n1)t(n2)(n2)!λnt(n1)(n1)!}+eλt{λ1!+λ2t1!++λ(n2)t(n3)(n3)!+λ(n1)t(n2)(n2)!}=eλt{(λ0!+λ1!)+(λ2t1!+λ2t1!)++(λ(n1)t(n2)(n2)!+λ(n1)t(n2)(n2)!)λnt(n1)(n1)!}=eλt{λnt(n1)(n1)!}Yn=Fn(t)t=[(eλt)A+eλt(A)]=[eλt{λnt(n1)(n1)!}]=eλtλnt(n1)(n1)!=eβtβαt(α1)(α1)!α=n,β=λ.=eβt(α1)!βαt(α1)=eβtΓ(α)βαt(α1),Γ(n)=(n1)! α=1の時,指数分布となる(事象と事象の間隔の確率分布). eβtΓ(α)βαt(α1)=eβtΓ(1)β1t(11)α=1=eβt1βt(0)Γ(n)=(n1)!,Γ(1)=(11)!=0!=1=eβtβt0=1=λeλtβ=λ

事象の発生する回数についての確率密度分布 (ポアソン分布)

単位時間当たりの事象の発生確率をλとし,t時間の間にk回事象が発生する確率を考える. tまでをn等分した時間をΔt=tnとして二項分布により以下のように表すことができる. p(k;λ,Δt)=nCk(λΔt)k(1(λΔt))(nk) 二項分布からポアソン分布を導いた時と同様にλλΔtとして計算を進めると以下のようになる. p(k;λ,Δt)=nCk(λΔt)k(1(λΔt))(nk)=n!k!(nk)!(λΔt)k(1(λΔt))(nk)=1k!{n(n1)(nk+1)}(λΔt)k(1(λΔt))(nk)=1k!{1(11n)(1k1n)nk}(λΔt)k(1(λΔt))(nk)=1k!{1(11n)(1k1n)}(nλΔt)k(1(λΔt))(nk)=1k!{1(11n)(1k1n)}(nλtn)k(1(λtn))n(1(λtn))kΔt=tn=1k!{1(11n)(1k1n)}(λt)k(1(λtn))n(1(λtn))k=1k!{1(11n)(1k1n)}(λt)k(1+1nλt)n(1(λtn))k=1k!{1(11n)(1k1n)}(λt)k{(1+1nλt)nλtλtn}n(1(λtn))k=1k!{1(11n)(1k1n)}(λt)k{(1+1nλt)nλt}λtnn(1(λtn))k=1k!{1(11n)(1k1n)}(λt)k{(1+1nλt)nλt}λt(1(λtn))k ここでnをに極限をとるとnを分母にもつ分数は0へ収束することや,収束数列によるネイピア数の定義により以下のようになる. limn1k!{1(11n)(1k1n)}(λt)k{(1+1nλt)nλt}λt(1(λtn))k=1k!{1(10)(10)}(λt)keλt(10)k=1k!(λt)keλt=(λt)kk!eλt

事象の発生する間隔についての確率密度分布 (指数分布)

ある事象が起こってから次の事象が起きるまでの時間をTとする. 事象が起こってからt時間までに次の事象が起きる確率は,tまでをn等分した時間をΔt=tnとして, “事象が(k1)回のΔtの間に発生しなかったのち次のk回目のΔtの間に発生する確率”のk=1からnまでの和によって以下のように表すことができる (独立同分布の和によって決まる過程,単位時間当たりの事象の発生確率(個々の分布)をλとする). P(Tt)=λΔt+(1λΔt)Δt+(1λΔt)2Δt++(1λΔt)(n1)Δt=k=1n(λΔt)(1λΔt)k1λΔtΔt(1λΔt)λΔtΔtΔt(1λΔt)2λΔt2ΔtΔt(1λΔt)n1λΔtn1ΔtΔt 初項をλΔt,公比を(1λΔt)とする等比級数として上式は以下のようになる. P(Tt)=λΔt+(1λΔt)Δt+(1λΔt)2Δt++(1λΔt)(n1)Δt=λΔt1(1λΔt)n1(1λΔt)k=1nar(k1)=a(1rn)1r=1(1λΔt)n=1(1λtn)nΔt=tn=1(1+1nλt)n=1{(1+1nλt)nλtλtn}n=1{(1+1nλt)nλt}λtnn=1{(1+1nλt)nλt}λt ここでnをに極限をとると収束数列によるネイピア数の定義より以下のようになる. limn1{(1+1nλt)nλt}λt=1eλtlimn+(1+1n)n=e 上式は時刻tまでの累積分布凾数F(t)となる. 累積分布凾数を微分することで確率密度凾数を得ることができる. F(t)=1eλtf(t)=dF(t)dt=0(λeλt)=λeλt

等比級数 (等比数列の和)

初項をa,公比をrとする数列の和,級数は以下のようになる. Sn=k=1nar(k1)=a+ar+ar2+ar3++arn1rSn=rk=1nar(k1)=ar+ar2+ar3++arn1+arnSnrSn=aarn(1r)Sn=a(1rn)Sn=a(1rn)1r

フィボナッチ数列(Fibonacci numbers)の行列表現と一般項

フィボナッチ数列(Fibonacci numbers)の行列表現

フィボナッチ数列 an+1=an+an1a1=1,a2=1 これを行列で表現すると以下となる. (an+1an)=[1110](anan1)a(n+1),n=Aan,(n1)

フィボナッチ数列の一般項

an,(n1)Aの固有ベクトルx1,2を用い表せれば, 上式は対応する固有値λ1,2を用いて以下のように表すことができる. a(n+1),n=Aan,(n1)=A(C1x1+C2x2)C1,C2=C1Ax1+C2Ax2=C1λ1x1+C2λ2x2Ax=λx またこれを繰り返すことで一般項として以下のように表せることになる. a(n+1),n=AnainitainitC1,C2=An(Cainit1x1+Cainit2x2)=Cainit1Anx1+Cainit2Anx2=Cainit1λ1nx1+Cainit2λ2nx2 そこでまずAの固有値を求める. |AλE|=0|[1110]λ[1001]|=|1λ11λ|=(1λ)(λ)1=λ2λ1=λ=(1)±(1)24(1)(1)2(1)=1±52λ1,λ2=1+52,152λ1>λ2 λ1に対応する固有値ベクトルx1を求める. (Aλ1E)x1=0[1λ111λ1](x11x12)=(00)[11+52111+52](x11x12)=(00)[152111+52](x11x12)=(00) {152x11+x12=0x111+52x12=0 x11=1+52x12x1=t(1+521)t: 同様にλ2に対応する固有値ベクトルx2を求める. (Aλ2E)x2=0[1λ211λ2](x21x22)=(00)[115211152](x21x22)=(00)[1+5211152](x21x22)=(00) {1+52x21+x22=0x21152x22=0 x21=152x22x2=t(1521)t: よって前述の表現は以下のように書き換えられる. (an+1an)=Cainit1λ1nx1+Cainit2λ2nx2=Cainit1(1+52)n(1+521)+Cainit2(152)n(1521) n=1の時,an=a1=1,an+1=a1+1=a2=1なので,ここからCainit1,Cainit2を求める. Cainit1(1+52)1(1+521)+Cainit2(152)1(1521)=(11) 簡単のために以下のようにひとまず置き直す. C1:Cainit1C2:Cainit2α1:1+52α2:152 上記で書き直す. C1(λ1)1(α11)+C2(λ2)1(α21)=(11) 行ごとに書き出すと以下のような連立方程式となる. {C1λ1α1+C2λ2α2=1C1λ1+C2λ2=1 C1について解く. C1λ1α2+C2λ2α2=α2α2(C1λ1α1+C2λ2α2)(C1λ1α2+C2λ2α2)=(1)(α2)C1λ1α1C1λ1α2=1α2C1λ1(α1α2)=1α2C1λ1(α1α2)=α11α2=1152=1+52=α1C1=α1λ1(α1α2)=1+521+52(1+52152)=11+52152=1252=15 C2について解く. C1λ1α1+C2λ2α1=α1α1(C1λ1α1+C2λ2α2)(C1λ1α1+C2λ2α1)=(1)(α1)C2λ2α2C2λ2α1=1α1C2λ2(α2α1)=1α1C2λ2(α2α1)=α21α1=11+52=152=α2C2=α2λ2(α2α1)=152152(1521+52)=11521+52=1252=15 以上よりフィボナッチ数列の一般項anは以下のように表すことができた. an=C1λ1n+C2λ2n=15(1+52)n15(152)n an+1側の式は以下のようになり, n+1を改めてnと置き直せば上式と同じになる. an+1=C1λ1nα1+C2λ2nα2=15(1+52)n1+5215(152)n152=15(1+52)n+115(152)n+1

指数分布族モデル / 共役な事前分布 / 予測分布

指数分布族モデル

q(x;θ)=v(x)exp(f(θ)g(x))Xq(x;θ)dx=Xv(x)exp(f(θ)g(x))dx=1v,f,g

共役な事前分布

π(θ;ϕ)=1z(ϕ)exp(f(θ)ϕ)Xπ(θ;ϕ)dx=X1z(ϕ)exp(f(θ)ϕ)dx=1z,f,ϕz(ϕ)=Θexp(f(θ)ϕ)dθz

予測分布

q(Xn+1|Xn)=1Zn(β)q(Xn+1|θ)βi=1n{q(Xi|θ)β}π(θ)dθ=1Zn(β)Θπ(θ)q(Xn+1|θ)βi=1nq(Xi|θ)βdθ=1Zn(β)Θπ(θ)i=1n+1q(Xi|θ)βdθi=1n+1q(Xi|θ)β=q(Xn+1|θ)βi=1nq(Xi|θ)β=1Zn(β)Zn+1(β)Zn+1(β)=Θπ(θ)i=1n+1q(Xi|θ)βdθ=Zn+1(β)Zn(β)

分配凾数

Zn(β)=Θπ(θ;ϕ)i=1nq(Xi;θ)βdθ=Θπ(θ;ϕ)i=1n[v(Xi)exp(f(θ)g(Xi))]βdθq(Xi;θ)=v(Xi)exp(f(θ)g(Xi))=Θ[1z(ϕ)exp(f(θ)ϕ)]i=1n[v(Xi)exp(f(θ)g(Xi))]βdθπ(θ;ϕ)=1z(ϕ)exp(f(θ)ϕ)=1z(ϕ)Θexp(f(θ)ϕ)i=1n[v(Xi)exp(f(θ)g(Xi))]βdθπ(θ;ϕ)=1z(ϕ)exp(f(θ)ϕ)=1z(ϕ)Θexp(f(θ)ϕ)i=1n[v(Xi)βexp(f(θ)g(Xi))β]dθ(ab)c=acbc=1z(ϕ)Θexp(f(θ)ϕ)[i=1nv(Xi)β][i=1nexp(f(θ)g(Xi))β]dθi=1nAB=i=1nAi=1nB=[i=1nv(Xi)β]1z(ϕ)Θexp(f(θ)ϕ)[i=1nexp(β{f(θ)g(Xi)})]dθexp(A)B=exp(AB)=[i=1nv(Xi)β]1z(ϕ)Θexp(f(θ)ϕ)[i=1nexp(f(θ)βg(Xi))]dθc(AB)=AcB(c:)=[i=1nv(Xi)β]1z(ϕ)Θexp(f(θ)ϕ+i=1nf(θ)βg(Xi))dθexp(A)exp(B)=exp(A+B)=[i=1nv(Xi)β]1z(ϕ)Θexp(f(θ)ϕ+f(θ)i=1nβg(Xi))dθAB+AC=A(B+C)=[i=1nv(Xi)β]1z(ϕ)Θexp(f(θ){ϕ+i=1nβg(Xi)})dθAB+AC=A(B+C)=[i=1nv(Xi)β]1z(ϕ)Θexp(f(θ)ϕ^β)dθϕ^β=ϕ+i=1nβg(Xi)=[i=1nv(Xi)β]1z(ϕ)z(ϕ^β)z(ϕ^β)=Θexp(f(θ)ϕ^β)dθ=[i=1nv(Xi)β]z(ϕ^β)z(ϕ)

自由エネルギー

Fn(β)=1βlogZn(β)=1βlog([i=1nv(Xi)β]z(ϕ^β)z(ϕ))=1βlog([i=1nv(Xi)β])1βlog(z(ϕ^β)z(ϕ))=1βlog([v(X1)βv(X2)βv(Xn)β])1βlog(z(ϕ^β)z(ϕ))=1βlog([v(X1)v(X2)v(Xn)]β)1βlog(z(ϕ^β)z(ϕ))=1ββlog([v(X1)v(X2)v(Xn)])1βlog(z(ϕ^β)z(ϕ))=log([v(X1)v(X2)v(Xn)])1βlog(z(ϕ^β)z(ϕ))=i=1nlogv(Xi)1βlog(z(ϕ^β)z(ϕ))

事後分布

q(θ;Xn)=1Zn(β)π(θ;ϕ)i=1nq(Xi;θ)β=1Zn(β)[i=1nv(Xi)β]1z(ϕ)exp(f(θ)ϕ^β)=1[i=1nv(Xi)β]z(ϕ^β)z(ϕ)[i=1nv(Xi)β]1z(ϕ)exp(f(θ)ϕ^β)Zn(β)=[i=1nv(Xi)β]z(ϕ^β)z(ϕ)=1z(ϕ^β)exp(f(θ)ϕ^β)=π(θ;ϕ^β)

上記事後分布で予測分布を書き直す

q(x;Xn)=Θq(x;θ)βq(θ;Xn)dθXnθθx()=Θq(x;θ)βπ(θ;ϕ^β)dθϕ^βθθx()=Θq(x;θ)β1z(ϕ^β)exp(f(θ)ϕ^β)dθ=Θ(v(x)exp(f(θ)g(x)))β1z(ϕ^β)exp(f(θ)ϕ^β)dθ=v(x)β1z(ϕ^β)exp(f(θ)g(x))βexp(f(θ)ϕ^β)dθ=v(x)β1z(ϕ^β)exp(f(θ)βg(x))exp(f(θ)ϕ^β)dθ=v(x)β1z(ϕ^β)exp(f(θ)(ϕ^β+βg(x)))dθ=v(x)β1z(ϕ^β)z(ϕ^β+βg(x))=v(x)βz(ϕ^β+βg(x))z(ϕ^β)=v(x)βz(ϕ+βg(X1)++βg(Xn)+βg(x))z(ϕ+βg(X1)++βg(Xn))

尤度凾数の期待値の平均情報量(離散/標本からの)

尤度凾数の期待値の平均情報量(離散/標本からの)

Tn=1ni=1nlog(EΘ[q(X;θ)])=1ni=1nlog(EΘ[q(X;θ0)exp(f(Xi,θ0,θ))])q(X;θ)=q(X;θ0)exp(f(Xi,θ0,θ))=1ni=1nlog(q(X;θ0)EΘ[exp(f(Xi,θ0,θ))])E[cX]=cE[X]=1ni=1n{log(q(X;θ0))+log(EΘ[exp(f(Xi,θ0,θ))])}log(AB)=log(A)+log(B)=1n{i=1nlog(q(X;θ0))+i=1nlog(EΘ[exp(f(Xi,θ0,θ))])}(A+B)=A+B=1ni=1nlog(q(X;θ0))1ni=1nlog(EΘ[exp(f(Xi,θ0,θ))])=Ln(θ0)1ni=1nlog(EΘ[exp(f(Xi,θ0,θ))])1ni=1nlog(q(X;θ0))=Ln(θ0)=Ln(θ0)+Tn(0)1ni=1nlog(EΘ[exp(f(Xi,θ0,θ))])=Tn(0)
Tn(0)=1ni=1nlog(EΘ[exp(f(Xi,θ0,θ))])=1ni=1nlog(EΘ[exp(logq(Xi;θ0)q(Xi;θ))])=1ni=1nlog(EΘ[exp(logq(Xi;θ)q(Xi;θ0))])=1ni=1nlog(EΘ[q(Xi;θ)q(Xi;θ0)])=1ni=1nlog(EΘ[q(Xi;θ)]q(Xi;θ0))=1ni=1nlog(EΘ[q(Xi;θ)]q(Xi;θ0))=1ni=1nlog(q(Xi;θ0)EΘ[q(Xi;θ)])

尤度凾数の期待値の平均情報量(連続)

尤度凾数の期待値の平均情報量(連続)

Gn=EX[log(EΘ[q(X;θ)])]=EX[log(EΘ[q(X;θ0)exp(f(Xi,θ0,θ))])]q(X;θ)=q(X;θ0)exp(f(Xi,θ0,θ))=EX[log(q(X;θ0)EΘ[exp(f(Xi,θ0,θ))])]E[cX]=cE[X]=EX[log(q(X;θ0))+log(EΘ[exp(f(Xi,θ0,θ))])]log(AB)=log(A)+log(B)=EX[log(q(X;θ0))]EX[log(EΘ[exp(f(Xi,θ0,θ))])]E[X+Y]=E[X]+E[Y]=L(θ0)EX[log(EΘ[exp(f(Xi,θ0,θ))])]EX[log(q(X;θ0))]=L(θ0)=L(θ0)+Gn(0)Gn(0)=EX[log(EΘ[exp(f(Xi,θ0,θ))])]:
Gn(0)=EX[log(EΘ[exp(f(Xi,θ0,θ))])]=EX[log(EΘ[exp(logq(Xi;θ0)q(Xi;θ))])]=EX[log(EΘ[exp(logq(Xi;θ)q(Xi;θ0))])]=EX[log(EΘ[q(Xi;θ)q(Xi;θ0)])]=EX[log(EΘ[q(Xi;θ)]q(Xi;θ0))]=EX[log(EΘ[q(Xi;θ)]q(Xi;θ0))]=EX[log(q(Xi;θ0)EΘ[q(Xi;θ)])]

自由エネルギー

自由エネルギー

Fn(β)=1βlogZn(β)Zn(β):=1βlog(Zn(0)(β)i=1nq(Xi;θ)β)Zn(β)=Zn(0)(β)i=1nq(Xi;θ0)β=1β(log(i=1nq(Xi;θ)β)+log(Zn(0)(β)))log(AB)=log(A)+log(B)=1βlog(i=1nq(Xi;θ)β)1βlog(Zn(0)(β))=1βlog(i=1nq(Xi;θ)β)+Fn(0)(β)Fn(0)(β)=1βlog(Zn(0)(β)):=1βlog(i=1nq(Xi;θ))β+Fn(0)(β)AB=(A)B=1ββlog(i=1nq(Xi;θ))+Fn(0)(β)logAB=BlogA=log(i=1nq(Xi;θ))+Fn(0)(β)=i=1nlogq(Xi;θ)+Fn(0)(β)log(i=1nAi)=i=1n(logAi)=n1ni=1nlogq(Xi;θ)+Fn(0)(β)n1n=1=n{1ni=1nlogq(Xi;θ)}+Fn(0)(β)=nLn(θ0)+Fn(0)(β)1ni=1nlogq(Xi;θ)=Ln(θ0)

事後分布

最適パラメータにおける条件付き分布

Zn(β)=Zn(0)(β)exp(nβLn(θ0))=Zn(0)(β)i=1nq(Xi;θ0)βi=1nq(Xi;θ0)β=exp(nβLn(θ0))
q(θ;Xn)=1Zn(β)π(θ)i=1nq(Xi;θ)β=1Zn(0)(β)exp(nβLn(θ0))π(θ)i=1nq(Xi;θ)βZn(β)=Zn(0)(β)exp(nβLn(θ0))=1Zn(0)(β)exp(nβLn(θ))exp(nβLn(θ0))π(θ)i=1nq(Xi;θ)β=exp(nβLn(θ))=1Zn(0)(β)exp(nβ(Ln(θ0)+Kn(θ)))exp(nβLn(θ0))π(θ)Ln(θ)=Ln(θ0)+Kn(θ)=1Zn(0)(β)exp(nβLn(θ0))exp(nβKn(θ))exp(nβLn(θ0))π(θ)exp(A+B)=exp(A)exp(B)=1Zn(0)(β)exp(nβKn(θ))π(θ)

正規化された分配凾数(2)

正規化された分配凾数(2)

Zn(β)=Θπ(θ)i=1nq(Xi;θ)βdθ=Θπ(θ)i=1n{q(Xi;θ0)exp(f(Xi,θ0,θ))}βdθq(Xi;θ)β={q(Xi;θ0)exp(f(Xi,θ0,θ))}β=(i=1nq(Xi;θ0)β)Θπ(θ)i=1nexp(f(Xi,θ0,θ))βdθ=(i=1nq(Xi;θ0)β)Θπ(θ)i=1nexp(βf(Xi,θ0,θ))dθ=(i=1nq(Xi;θ0)β)Θπ(θ)exp(βi=1nf(Xi,θ0,θ))dθi=1nexp(Ai)=exp(i=1nAi)=(i=1nq(Xi;θ0)β)Θπ(θ)exp(βnKn)dθi=1nf(Xi,θ0,θ)=nKn(θ)=(i=1nq(Xi;θ0)β)Θπ(θ)exp(nβKn)dθ=(i=1nq(Xi;θ0)β)Zn(0)(β)Zn(0)(β)=Θπ(θ)exp(nβKn(θ))dθ:=Zn(0)(β)i=1nq(Xi;θ0)β

正規化された分配凾数

正規化された分配凾数

i=1nq(Xi;θ)β=exp(log(i=1nq(Xi;θ)β))A=exp(log(A))=exp(i=1nlog(q(Xi;θ)β))log(i=1nAi)=i=1nlog(Ai)=exp(βi=1nlog(q(Xi;θ)))=exp(nβ(1ni=1nlog(q(Xi;θ))))(n)(1n)=1=exp(nβLn(θ))Ln(θ)=1ni=1nlog(q(Xi;θ))
Zn(β)=Θπ(θ)i=1nq(Xi;θ)βdθ=Θπ(θ)exp(nβLn(θ))dθi=1nq(Xi;θ)β=exp(nβLn(θ))=Θπ(θ)exp(nβ(Ln(θ0)+Kn(θ)))dθLn(θ)=Ln(θ0)+Kn(θ)=Θπ(θ)exp(nβLn(θ0)nβKn(θ))dθ=Θπ(θ)exp(nβLn(θ0))exp(nβKn(θ))dθ=exp(nβLn(θ0))Θπ(θ)exp(nβKn(θ))dθ=exp(nβLn(θ0))Zn(0)(β)Zn(0)(β)=Θπ(θ)exp(nβKn(θ))dθ:=Zn(0)(β)exp(nβLn(θ0))

事後分布/分配凾数

分配凾数

xn=(x1,x2,,xn)np(x)p(xn)=i=1np(xi)=p(x1)p(x2)p(xn)Xn=(X1,X2,,Xn)xnn(xnp(x))
q(x;θ)θ()π(θ)β0<β<q(θ;Xn)=1Zn(β)π(θ)i=1nq(Xi;θ)ββθZn(β)=Θπ(θ)i=1nq(Xi;θ)βdθ(β=1)θβ1

不偏推定量は一意性を持たない

不偏推定量は一意性を持たない

E[X¯]=μX¯E[Y]=μY=0 の時, E[X¯+Y]=E[X¯]+E[Y]=μX¯+μY=μX¯+0=μX¯ であり,E[X¯+Y]E[X¯]で不偏推定量の値に違いがない.

尤度凾数の平均情報量(離散/標本からの)

尤度凾数の平均情報量(離散/標本からの)

p(x)θq(x;θ)θ()(θx)Θ0p(x)q(x;θ)θ0p(x)q(x;θ)(θ0Θ0)q(x;θ)(xθ(xθ))logq(x;θ)logq(x;θ)()
Ln(θ)=E[log(1q(Xi;θ))]()=E[log(q(Xi;θ)1)]1A=A1=E[log(q(Xi;θ))]logAB=BlogA=E[log(q(Xi;θ))]E[cX]=cE[X]=1ni=1nlog(q(Xi;θ))n=1ni=1nlog(q(Xi;θ)q(Xi;θ0)q(Xi;θ0))θ0:=1ni=1nlog(q(Xi;θ0)q(Xi;θ)q(Xi;θ0))=1ni=1n{log(q(Xi;θ0))+log(q(Xi;θ)q(Xi;θ0))}logAB=logA+logB=1n{i=1nlog(q(Xi;θ0))+i=1nlog(q(Xi;θ)q(Xi;θ0))}(A+B)=A+B=1ni=1nlog(q(Xi;θ0))1ni=1nlog(q(Xi;θ)q(Xi;θ0))=1ni=1nlog(q(Xi;θ0))+1ni=1nlog((q(Xi;θ)q(Xi;θ0))1)logx=logx1=1ni=1nlog(q(Xi;θ0))+1ni=1nlog(q(Xi;θ0)q(Xi;θ))(AB)1=1AB=BA=Ln(θ0)+Kn(θ)Ln(θ0)=1ni=1nlog(q(Xi;θ0)),Kn=1ni=1nlog(q(Xi;θ0)q(Xi;θ))
f(Xi,θ0,θ)=logq(Xi;θ0)q(Xi;θ)()Kn(θ)=1ni=1nf(Xi,θ0,θ)KLnKn(θ)=i=1nf(Xi,θ0,θ)Ln(θ)=Ln(θ0)+Kn(θ)Kn(θ)>0KLKn(θ)=0θΘ0exp(f(Xi,θ0,θ))=q(Xi;θ0)q(Xi;θ)A=log(B),exp(A)=Bq(Xi;θ)=q(Xi;θ0)1exp(f(Xi,θ0,θ))=q(Xi;θ0)exp(f(Xi,θ0,θ))

尤度凾数の平均情報量(連続)

尤度凾数の平均情報量(連続)

p(x)θq(x;θ)θ()(θx)Θ0p(x)q(x;θ)θ0p(x)q(x;θ)(θ0Θ0)q(x;θ)(xθ(xθ))logq(x;θ)logq(x;θ)()
L(θ)=EX[log(1q(x;θ))]()=EX[log(q(x;θ)1)]1A=A1=EX[log(q(x;θ))]logAB=BlogA=EX[logq(x;θ)]E[cX]=cE[X]=q(x;θ0)log(q(x;θ))dxθ0:=q(x;θ0)log(q(x;θ)q(x;θ0)q(x;θ0))dx=q(x;θ0)log(q(x;θ0)q(x;θ)q(x;θ0))dx=q(x;θ0){log(q(x;θ0))+log(q(x;θ)q(x;θ0))}dxlogAB=logA+logB=q(x;θ0)log(q(x;θ0))dxq(x;θ0)log(q(x;θ)q(x;θ0))dxXABdx=XAdx+XBdx=q(x;θ0)log(q(x;θ0))dx+q(x;θ0)log((q(x;θ)q(x;θ0))1)dxlogx=logx1=q(x;θ0)log(q(x;θ0))dx+q(x;θ0)log(q(x;θ0)q(x;θ))dx(AB)1=1AB=BA=EX[logq(x;θ0)]+EX[log(q(x;θ0)q(x;θ))]=L(θ0)+K(θ)L(θ0)=EX[logq(x;θ0)],K(θ)=EX[logq(x;θ0)q(x;θ)]
f(θ0,θ;x)=logq(x;θ0)q(x;θ)()K(θ)=EX[f(θ0,θ;x)]KLL(θ)=L(θ0)+K(θ)K(θ)>0KLK(θ)=0θΘ0exp(f(θ0,θ;x))=q(x;θ0)q(x;θ)A=log(B),exp(A)=Bq(x;θ)=q(x;θ0)1exp(f(θ0,θ;x))=q(x;θ0)exp(f(θ0,θ;x))