自発的なデータ学習の展望
統計科学セミナー
開催期間
2015.7.17(金)
16:00 ~ 17:30
16:00 ~ 17:30
場所
九州大学 伊都キャンパス 数理学研究教育棟3階 中セミナー室7
講演者
江口 真透 (統計数理研究所)
概要
最尤推定論の発展の中で様々な統計モデルが考察されてきた.正規分布の平均のロバストな推定のために両側指数(ラプラス)分布モデルで最尤推定を考えると標本メディアンが導かれる.このように推定は最尤推定に固定して可能な様々なモデルを想定する枠組みはモデル選択においても標準的となっている.この発表では,これと逆のことを考察する:モデルを固定して様々な推定量の中から最適な推定量を選択したい.真の分布は多峰まで想定するがモデルは標準的な単峰モデルを考える.一方で,推定はできるだけ多様な推定量を考えよう.ある特別な推定方法を選択するとモデルから乖離した真の分布の情報を取り出すことができる.これを自発的なデータ学習と呼ぶ.例えば,真の分布を多変量正規混合分布で多峰であるとし,ワーキングモデルとして正規平均モデルを採用し,最小ベキダイバージェンスで推定を考える.ただしベキパラメータは自由に動かす.ベキダイバージェンスの正規平均に対する経験ロス関数は複数個の局所最小値を持つことが分かる.一方で負の尤度関数は凸関数となり最尤推定量は標本平均ベクトルに他ならない.ベキパラメータを適切に選択すると,その局所最小解の集合が正規混合分布の中の正規分布の平均の集合に一致することが示せる.さらにノンパラメトリックな密度推定ができることが分かる.従来のパラメトリックモデルの誤特定の議論とは全く違う観点から自発データ学習の新たな可能性について考察したい.
なお,本セミナーの前に,7/15~7/17の日程で江口先生による集中講義「情報幾何と統計学」が開催されます.
http://www.math.kyushu-u.ac.jp/seminars/view/1566