機械学習の問題設定

機械学習の問題設定

機械学習の問題設定を見直したのでメモ.

(Ω,F,P)(\Omega, \mathcal{F}, P): ベースとなる確率空間
(X,FX)(\mathcal{X}, \mathcal{F}_{\mathcal{X}}): 入力となる可測空間
(Y,FY)(\mathcal{Y}, \mathcal{F}_{\mathcal{Y}}): 出力となる可測空間
Z=X×Y\mathcal{Z} = \mathcal{X} \times \mathcal{Y}
mNm \in \mathbb{N}: サンプル数
Xi:ΩX,i=1,,mX_i: \Omega \to \mathcal{X}, \forall i = 1, \ldots, m
Yi:ΩY,i=1,,mY_i: \Omega \to \mathcal{Y}, \forall i = 1, \ldots, m
Zi=(Xi,Yi):ω(Xi(ω),Yi(ω)),i=1,,mZ_i = (X_i, Y_i): \omega \mapsto (X_i(\omega), Y_i(\omega)), \forall i = 1, \ldots, m
Sm:ω(Z1(ω),,Zm(ω))S_m: \omega \mapsto (Z_1(\omega), \ldots, Z_m(\omega)): サンプル

i.i.d.
For all iji \neq j, ZiZ_iZjZ_jは独立
PZ11==PZm1P \circ Z_1^{-1} = \cdots = P \circ Z_m^{-1}

PZ=PZ11P_{Z} = P \circ Z_1^{-1}とする.
Dm=PSm1D_m = P \circ S_m^{-1}

ここまでで一通りの準備を終えた.

H\mathcal{H}: hypothesis set
:H×Z[0,)\ell: \mathcal{H} \times \mathcal{Z} \to [0, \infty): loss function

generalization error

L(h):=EPZ[(h,z)] \begin{aligned} L(h) := \mathbb{E}_{P_Z} \left[\ell(h, z)\right] \end{aligned}

ここで,Agnostic PAC learningという概念を紹介しておく.ざっくり書くと,以下のような感じ.

H\mathcal{H} is Agnostic PAC learnable if there exists sample complexity mH:(0,1)2Nm_\mathcal{H}: (0, 1)^2 \to \mathbb{N} and learning algorithm AH:SmBH\mathcal{A}_\mathcal{H}: S_m \mapsto B \subset \mathcal{H} which satisfy the following property:

For all ϵ,δ(0,1)\epsilon, \delta \in (0, 1)

mmH(ϵ,δ)hAH(Sm),L(h)ϵ \begin{aligned} m \geq m_\mathcal{H}(\epsilon, \delta) \Rightarrow \forall h \in \mathcal{A}_{\mathcal{H}}(S_m), L(h) \leq \epsilon \end{aligned}

with probability at least 1δ1 - \delta

まず,我々は\ellを定めることから始める.LLを定めてもいい.よくある二乗誤差なんかをここで使うべきではなく(使っても良いけど),本当に最小化したいものをここに持ってくる.indicator functionを使うといいと思う.

H\mathcal{H}\ellが与えられればAgnostic PAC learnableかどうか調べ始めることは可能だと思うが,普通はそうしないと思う.個人的には,H\mathcal{H}はアルゴリズムとセットで考えるべきだと思っている.アルゴリズムまで考えて,それが,Agnostic PAC learnerかどうかを調べるのが良いと思う.

Written with StackEdit.

0 件のコメント:

コメントを投稿

機械学習の問題設定

機械学習の問題設定 機械学習の問題設定を見直したのでメモ. ( Ω , F , P ) (\Omega, \mathcal{F}, P) ( Ω , F , P ) : ベースとなる確率空間 ( X , F X ) (\mathcal...