ベイズ学習の基本であるパラメータの事後分布および未観測データの予測分布の計算についての概要.
一般的に,機械学習モデルのもつパラメータをデータから決定することを学習と呼ぶ. ベイズ推論の枠組みでは,パラメータも何らかの不確実性を持っているような確率変数として扱う. この不確実性を持つパラメータの事後分布をデータの観測によって求めることが学習にあたる.
また,このようにして得られたモデルのパラメータに基づいて,未観測データに対する推論を行う際も,予測分布を確率推論を用いて求める.
パラメータの事後分布
訓練データ集合をとする. ベイズ学習では同時分布について考えることで,データを表現するようなモデルを構築する.
はモデルに含まれる未知のパラメータであり,観測されていないものとする. パラメータに関する事前の不確実性は事前分布を与えることでモデルに反映させることができる.
また,はあるパラメータからどのようにしてデータが発生するのかを記述している. このをパラメータについての尤度関数と呼ぶ.
データを観測したあとでは,パラメータの不確実性はベイズの定理を用いて以下のように更新される:
この条件付き分布の計算がベイズ学習における学習にあたる.
予測分布
学習された分布を用いて,未観測のデータに対する予測分布を計算したい. データ,未知データ, パラメータに関する同時分布は,
となる. 現在,データのみが手元にあるとすると,残りの変数の事後分布は,
上記の式においてパラメータを積分除去すると,
となり,求めたい予測分布が得られる.