2つの互いに独立な確率変数
(Ω,F,P)
(X,MX)
(Y,MY)
X:Ω→X
Y:Ω→Y
(X,Y):ω↦(X(ω),Y(ω))
PX,Y=P∘(X,Y)−1
PX=PX,Y(⋅×Y)=P∘X−1
PY=PX,Y(X×⋅)=P∘Y−1
PX,Yも直積測度PX×PYも,(X×Y,MX×MY)上の測度.
XとYが独立なら,PX,Y=PX×PY.
f:X×Y→[0,∞)
フビニ:
∫X×Yf(x,y)d(PX×PY)=∫X{∫Yf(x,y)dPY}dPX=∫Y{∫Xf(x,y)dPX}dPY
XとYが独立なら,EPX,Y[f(x,y)]=EPX[EPY[f(x,y)]]=EPY[EPX[f(x,y)]]
empirical distributionとsample
f:X→[0,∞)
DX(m)=m1∑i=1mδxi
EPX[f]≈EDX(m)[f]=m1∑i=1mf(xi):=g(x)
S:ω↦(X1(ω),…,Xm(ω))
PS=P∘S−1
EPS[g]=EP[g(S)]=m1∑i=1mEP[f(Xi)]=m1∑i=1mEPXi[f]=m1∑i=1mEPX[f]=EPX[f]
Complexity
XとYは独立とする.
supg∈GYg(X)が大きい方が複雑度が高い.
EP[g∈GsupYg(X)]=EPX,Y[g∈Gsupyg(x)]≈EDX,Y(m)[g∈Gsupyg(x)]=m1i=1∑mg∈Gsupyig(xi)=:f(x,y)
SY:ω↦(Y1(ω),…,Ym(ω))
for x∈Xm, C^(G)=EPSY[f(x,⋅)]を,empirical complexityと呼ぶことにする.
SX:ω↦(X1(ω),…,Xm(ω))
EPSX[C^(G)]を,complexityと呼ぶことにする.
complexityのイメージは多分こんな感じ.Y∈{−1,1}にして,PYをuniformだとすれば,Rademacher complexityになるはず.
うーんでも,ちょっとまだきになるところがあるので,明日やろうと思う.
Written with StackEdit.
0 件のコメント:
コメントを投稿