栁原 宏和

栁原 宏和

教授
栁原 宏和
HIROKAZU YANAGIHARA

データ解析を支える理論的研究に挑戦しよう。

データの解析法に妥当性を与える理論的研究

私は、統計学に関する理論的研究、特に、複数の変数を持つ多変量データの解析手法である多変量解析法について、数学を使って妥当性を与えるための理論的考察や、新たな手法の構成などを手がけています。最近では、変数の数が巨大な多変量データ(高次元データ)を解析するための手法の開発や、それらの手法の理論的妥当性を与えるような研究を行っています。より、具体的に言えば、高次元データでの多変量解析法において、それらの変数が必要か不必要かを判断する変数選択法において、本当に必要な変数がきちんと選ばれる確率が、標本数を無限大とすれば1になるという性質(一致性)を保持する変数選択法の開発に力を入れています。

高次元データの解析ニーズが高まっている

近年、データを蓄積・解析できる数は爆発的に大きくなっています。そのため、高次元データの解析に対するニーズが高まっています。従来の多変量解析法は、標本数のみ無限大とする漸近理論により理論的な妥当性を評価しています。そのような評価は、標本数を無限大したときの評価となります。しかしながら、高次元データでは、従来の漸近理論による評価がうまくいかないことがあります。つまり、漸近理論に基づく評価がよくても、実際の有限標本ではまったく機能しないということが起きます。そのような問題点は、多変量データの変数の数である次元も標本数とともに大きくする、新しい漸近理論による再評価を与えることで回避できます。従来の評価ではうまくいくとされていた手法が、新たな評価ではうまくいかないことがわかったときなどが非常に楽しい瞬間です。

理論的研究は非常に重要なもの

データサイエンスの研究に必要な知識・能力は、データの背景を意識しつつ、 データを俯瞰する能力。数学的な表現に慣れがあり、そのような表現が好きなことだと考えます。近年では、理論的な研究は軽視されがちです。しかしながら、解析法に妥当性がなければ、その解析法を積極的に使用できなくなります。そのため、理論的な研究は非常に重要であると言えます。私は、統計学に基づくデータ解析法をもっと世の中に普及させたいと思っています。みなさんもそのような理論的な研究を行ってみませんか。


up