予測分布論の進展
開催期間
16:00 ~ 17:00
場所
講演者
概要
予測分布は現在の観測に基づいた将来の観測の分布であり、統計・機械学習・情報理論で現れ、数多くの応用を持つ。 分布で考えることで点予測だけではなく予測の不確実性の評価を行うこともできる。
本発表では、講演者の高次元での予測分布構築法と予測分布を用いたモデル評価指標に関する研究を紹介する。 前半では高次元カウントデータに対する予測分布構成法(Yano et al., 2021)を紹介する。高次元カウントデータは多岐にわたる学術分野や実社会で現れる。例えば、商品の購入者数、犯罪発生件数、地震の発生件数、遺伝子の発現数、太陽の黒点数などである。高次元カウントデータではしばしばゼロあるいはニアゼロが過剰に現れる。このような性質をもつデータに対する最適な予測分布構成法を議論する。提案する構成法はスパイク-スラブ型の事前分布に基づくベイズ予測分布であるが、ミニマクス最適性を担保するためにスラブの裾に関する条件が存在することがポイントである。
後半ではベイズ予測分布を用いた予測のモデル評価規準であるWidely-Applicable Information Criterion (WAIC)の拡張 (Iba and Yano, in preparation)に関して紹介する。
WAICはモデルごとの情報量の微分計算を必要とせず一回のMarkov Chain Monte Carlo法の実行で計算できることもあり、R,Pythonの様々なライブラリで標準実装されており幅広く活用されている。
WAICを共変量シフト適応・因果推論・擬似ベイズを用いた予測など多様な予測の状況に対応できるように拡張したPosterior Covariance Information Criterion (PCIC)を提案する。
当日はPCICの理論的性質、Cross validationとの関係、および例での有効性を報告する。
[1] Keisuke Yano, Ryoya Kaneko, and Fumiyasu Komaki (2021), Minimax predictive density for sparse count data, Bernoulli 27(2): 1212–1238.
[2] Yukito Iba and Keisuke Yano, Posterior Covariance Information Criterion, in preparation.
参加方法:下記のURLから7月14日(水)17:00までに参加登録をお願いします(所属先の記載も必須です)。
承認されましたら、ZoomのURLが届きます。(承認に時間を要することがありますがご容赦ください)
https://zoom.us/meeting/register/tJEkc-irpzIjHdejoWJVt6x3KPNcM4HKTEDv