特定された不確実性を利用する貪欲かつ楽観的なクラスタリングとその周辺
統計科学セミナー
開催期間
2023.3.15(水)
16:00 ~ 17:00
16:00 ~ 17:00
場所
C-502 大講義室
講演者
奥野 彰文 (統計数理研究所)
概要
天体の位置情報を観測すると,天体が太陽系より遠くにあるほど誤差が大きくなるし,近くにあるほど誤差は小さくなる.このように,実際のデータ解析において観測値は個体ごとに異なった大きさの誤差を持ちうる.さらに観測された情報は非線形な処理によって意味のある物理量に変換されることが多々あり,データ解析時の誤差分布に特定の正規分布を仮定することも難しい.本研究はこのような実際的な問題を鑑みて,特定された不確実性を貪欲かつ楽観的に利用するGreedy and Optimistic Clustering (GOC)アルゴリズムを提案する.GOCアルゴリズムはユーザが指定した任意の既存クラスタリング法を反復するきわめて単純ながら効果的なアルゴリズムであり,天文シミュレーションで得られたデータに適用すると既存法からクラスタリングスコアを向上させることがわかる.また実際の天文データの解析においても,不確実であるがゆえにこれまで除外されていた天体を考慮しながら既存結果と一貫性を持った結果が得られた.大局的に見れば提案法はロバスト推定やロバスト最適化とも深い関わりがあり,統計的な観点からの解釈についても紹介したい.本研究は国立天文台/統計数理研究所の服部公平博士とミシガン大のIan Roederer博士との共同研究であり,プレプリントが https://arxiv.org/abs/2204.08205 https://arxiv.org/abs/2207.04110 で公開されている.