(廃止)大規模データコンピューティングプロジェクト研究センター

センター基本データ

本プロジェクト研究センターは、期間満了のため廃止されました。

  • 整理番号:25-01
  • 設置期間:2013年04月01日~2016年03月31日
  • センター長(所属/職名/氏名):大学院工学研究院 情報部門 / 教授 / 栗田 多喜夫

プロジェクト概要

目的

大規模データを効率的に処理するための処理アルゴリズムの開発とそれを実行するための超並列分散システムの要素技術を開発する。具体的には、大量データを 処理できるように現在の機械学習のアルゴリズムを高速化するための研究を行う。また、超並列分散コンピューティングプロジェクト研究センターでの研究成果 を発展させ、大規模データを効率的に処理するための超並列分散コンピューティング技術を開発する。
機械学習やシステム最適化の専門家と分散並列コンピューティングの専門家が協力して、それぞれの技術を融合させた大規模データコンピューティング手法の 開発を目指す。特に、超並列分散システムの高速化のための最適化に、機械学習による予測モデルやゲーム理論的な最適化のアプローチを導入する。このような アプローチは、本プロジェクト研究センター独自のアプローチである。また、機械学習アルゴリズムを超並列分散システム上で高速化する研究も世界的にも始 まったばかりであり、新規性が高いと考えられる。

背景

インターネットやスマートフォン等の急速な普及で日々膨大な量のデータが蓄積されている。スマートフォン等の情報端末を利用して、いつでも、どこでも、誰 でもが簡単に情報を発信できるようになった。街には至る所にセンサーが張り巡らされている。それらの膨大なデータを有効利用することで、社会システムが大 きく変わりつつある。
そうした大規模なデータに対して、すべてを人が見て解析手法を考えることは難しい。これらの分野では、比較的少数の訓練用のデータから自動的にコン ピュータでモデルを構築する機械学習と呼ばれる手法が有効である。実際、大規模データを扱う多くの分野で機械学習の応用が急速に拡大している。
一方、超並列分散コンピューティングでは、「京」のように世界とその高速計算性能を競う計算機の他に大量のコンピューティングデバイスを利用して計算す るクラウド・コンピューティングが一般化してきている。また、手元のクライアントもスマートフォンからマルチコアのグラフィック用プロセッサ(GPU)を 搭載したワークステーションまで多様化してきている。また、これらのコンピュータを接続するネットワークも超高速のネットから低速の電話網まで様々であ り、ネットワークの利用状況により利用可能な通信容量は時々刻々と変化する。これらすべての計算資源を処理するデータに応じて最適化することが、ますます 重要となってきている。
さらには、多用な端末の普及により、コンピュータに不慣れな利用者が増加しているが、そうした利用者は適切な応答時間でデータが処理できないと待ちきれ ず誤った操作をしてしまう。つまり、そのような利用者のための良いインターフェースのためにも、データの実時間での高速処理の必要性がますます増大してい る。

研究計画

本プロジェクト研究センターでは、大規模データコンピューティングを実現するために、大規模データの解析手法の開発を目指した(1)大規模データ解析アル ゴリズムの開発と、それを支える基盤技術の開発を目指した(2)超並列分散コンピューティング技術の開発、それらを統合した大規模データの超並列分散処理 を実現する(3)大規模データの超並列分散コンピューティング手法の開発の3つの研究課題について研究し、大規模データコンピューティングの実応用への展開を図る。


up