柳井の一般化決定係数を用いたデータ適応的検定
統計科学セミナー
開催期間
2023.5.26(金)
16:00 ~ 17:00
16:00 ~ 17:00
場所
C-502大講義室
講演者
植木 優夫 (長崎大学)
概要
ゲノムデータなどの高次元データ解析では,一変量回帰を変数ごとに独立に適用して有用な変数をスクリーニングする方法がしばしば用いられる.この方法は単独で強い効果を示す変数を見出すことができるが,他の変数と組み合わせることで現れてくる効果は検出困難である.一方で,すべての変数を用いた飽和モデルは高次元のデータにおいて機能しないことも多い.遺伝子などの事前に定義された変数グループを利用できる場合においては,グループ単位での解析方法が提案されているものの,グループの定義自体が不確かさを含んでいる場合は検出力が限定的となる.本発表では,モデル選択を取り入れたデータ適応的検定手法を提案する.これは,例えば罰則付き回帰のように複雑度の低いモデルから複雑度の高いモデルを繋ぐ回帰モデル列からモデルを選択した後で条件付き期待値に対する検定を行うものであり,帰無仮説の下で柳井の一般化決定係数が複雑なモデルを選ぶ性質を利用している.本手法は,確率値を算出する際にシミュレーションによる高負荷な計算を必要としないため,ゲノムデータなどの大規模な検定が必要とされる状況であっても容易に使用できる.数値実験により提案法が高い検出力を有することを示す.また,実際のゲノムデータへの適用例を紹介する.