統計的ダイバージェンスと外れ値に対し頑健なモデル選択規準について
統計科学セミナー
開催期間
2022.10.25(火)
16:00 ~ 17:00
16:00 ~ 17:00
場所
C-502 大講義室
講演者
倉田 澄人(九州大学マス・フォア・インダストリ研究所)
概要
自然現象や人間行動を表現する統計モデルは様々作製することが出来るが、実態に即していないモデルは運用に値せず、一方でただ手元のデータのみに適合させることに執心したモデルは汎用性に欠ける為、モデル候補の中から妥当性の高いものを選出する尺度が重要となる。AIC等の情報量規準の多くは、確率分布間の「遠さ」を測る尺度である統計的ダイバージェンスの一つであるKL divergenceに基づき、現象の背後にある真の確率分布と最も「近い」確率分布を持つモデルを選択するものとして導出されている。 ところで実データには、突出した能力や災害級の現象、機器の故障、人的ミス等々、様々な背景を持つ外れ値が付き纏う。この外れ値が混入している場合に、従来の選択手法の多くは精度を落としてしまうことが知られている。外れ値に対する強さ(頑健性)を実現する為に、母数推定や仮説検定の分野においてはしばしばKL divergenceの代わりに別のダイバージェンスを用いる手法が採られている。BHHJ divergence family (Basu et al. 1998, Ghosh and Basu 2013)はその代表的な一つであり、諸分野で多くの成果を上げている。本発表ではこのダイバージェンス並びに関連する族に基づいた選択規準を、モデル選択における頑健性という観点から検証した研究について紹介する。