現代的データ科学の数理:新しい高次元統計とインコンテキスト学習の統計理論
統計科学セミナー
開催期間
2024.2.16(金)
16:00 ~ 17:00
16:00 ~ 17:00
場所
C-501大講義室
講演者
今泉 允聡(東京大学 大学院総合文化研究科)
概要
現代的データ科学のひとつである深層学習・人工知能技術が大きく発展し、これらの効率的に制御・発展させるための数理的な理解が求められている。本講演では、このトピックに関連する二種類の研究を紹介する。(I) ひとつ目は、大規模ニューラルネットワークに代表される過剰パラメータモデルのための高次元統計である。従来の高次元統計は余剰次元を削減する方法論を発展させてきたが、近年の大自由度モデルは明示的な余剰次元を持たないため、近年は異なる方法論が発展している。本講演では、この方法論をより実践的な統計モデルに応用した研究成果を紹介する。 (II)ふたつ目は、ChatGPTなどの基盤モデルという人工知能技術を説明する、インコンテキスト学習というスキームの統計理論的解析である。本研究では、基盤モデルに用いられるトランスフォーマーの観測分布を効率的に扱えるという性質により、インコンテキスト学習が一定条件下で効率的な学習を実現できることを議論する。