高次元データに対する変数選択について
統計科学セミナー
開催期間
2016.2.19(金)
16:30 ~ 17:30
16:30 ~ 17:30
場所
九州大学 伊都キャンパス ウエスト1号館 中セミナー室 W1-D-710
講演者
伊森 晋平 (大阪大学大学院基礎工学研究科)
概要
本研究では,サンプルサイズに比べ説明変数の個数が多い場合の線形回帰モデルについて考える.このような高次元線形回帰モデルに対し,与えられた説明変数の組み合わせ(候補モデル)の集合から最も良いものを選択する必要がしばしば生じる.高次元線形回帰モデルでは,考えられる候補モデルは膨大な数になるため,伝統的な選択手法である情報量規準の最小化は計算量という観点からみると好ましくないことがある.
近年この問題点を解決するために,不要な説明変数や候補モデルのスクリーニングを用いた変数選択手法が注目されている.そこで,本研究では説明変数の重要度の順序付けによって候補モデルをスクリーニングすることを考える.さらに,スクリーニングされた候補モデルの集合に対する変数選択について,その性質を議論する.また,真のモデルが候補モデルの集合に含まれていない場合の選択結果についても考察する.