玉木 徹准教授にインタビュー!

玉木 徹准教授にインタビュー!

画像認識を中心に、人工知能をさらに進化させる研究。

画像や映像を理解し、読み解く。期待の高まる「人工知能」の研究。

玉木先生1

 「AI=人工知能」が世の中をにぎわせています。「人工知能」というのは、人間の知能と同様のことをコンピュータによって再現させるシステムや技術などを指しますが、私がおこなっているのはまさにその「人工知能」の研究です。なかでも、コンピュータに取り入れた画像や映像を理解する「コンピュータビジョン」の分野で、特に「画像認識」をメインに研究をしています。

 画像認識の分野の研究自体は、1970年代頃からずっとおこなわれているのですが、なかなか実用化には至りませんでした。ところが、2000年にブレイクスルー(=科学の飛躍的な進歩、行き詰まりの打開)が起きて一気に普及し、2005年にはすべてのデジカメに顔認識機能が搭載されました。いまではスマートホンのカメラや監視カメラにもこの機能が搭載されていますね。いずれも画像の中の顔を認識して検出する「顔認識」あるいは「顔検出」という技術が生かされたものです。そして、2012年に開催された画像認識の国際的なコンペティションで、深層学習を利用した画像認識の精度の飛躍的な向上が実証され、再びブレイクスルーが起こります。そこからさまざまな技術が開発されて、その後のAIブームへとつながっていきました。ひとたびブレイクスルーが起こると、コンピュータの性能の向上も手伝って、それまでの研究成果が驚くほどの勢いで商用にのせられ普及します。こうして画像認識の技術は、いつの間にか大変身近なものとなっています。
 画像認識にはさまざまなものがあります。例えば、顔認識の場合には、画像の中の顔を「顔である」と理解して検出しますが、さて、顔を顔だと理解するというのは、いったいどういうことなのでしょうか。輪郭の中に、目という黒い部分があって、その上に黒い眉毛があって、その下に赤っぽい口がある。そういうものを見つければよいのではないかと考えて、昔の人は研究していたのですが、なかなかうまくいきませんでした。ポイントは、AIが人間の脳に似た働きをするということです。人間の脳の仕組みを模した人工知能のモデルを「ニューラルネットワーク」と言いますが、AIの一種であるディープラーニングには、このニューラルネットワークが重要な役割を果たしています。画像認識は、人間の脳がおこなうのと同じように、「画像を理解する」技術であると捉えられています。もちろん、顔だけにとどまらず、さまざまな情報を取り出すことが可能ですから、画像認識の技術は、医療分野や土木分野をはじめ、幅広く応用されて、人間には難しい情報処理を可能にしているのです。

さまざまな分野に応用される画像認識技術を研究。新たなタスクへの挑戦も。

 それでは、私がおこなってきた画像認識研究の具体例をいくつか紹介しましょう。

 過去には、広島大学の生物生産学部の先生と共同で、「乳牛の3D形状計測システム」を研究していました。これは、農場にいる乳牛をカメラで撮影して、その体型を計測するというもので、胴まわりの大きさや体重などを測ることが困難な乳牛に対して、画像認識の技術を応用した計測システムでその状態を管理しようとするものです。また、工学部の土木の先生と一緒に、波の力を弱める消波ブロックの配置状況を画像から3D形状計測を行い把握するという研究にも携わりました。

 さらに現在は、次のような研究に取り組んでいます。
 ひとつは、「大腸がん認識システム」に関する研究。これは、大腸内視鏡カメラで撮影した画像から大腸がんを検出するシステムの構築をめざすもので、10年前ぐらいから医療機関と共同で進めており、臨床で利用した場合の有効性を確認する論文も発表しています。いわゆる「画像診断」の技術ですが、スタート時よりもさまざまな技術が進んできた現在、30cm程度の大きさにまでコンパクト化して、モニターに接続すると、がんなのかどうかを画像から診断するようなものをめざして、さらに研究を進めているところです。

 次に、「映像からの動作認識・行動認識」に関する研究。これは、コンピュータにある映像を与えて、例えば、「バイバイ」や「しゃがむ」などの10種類の動作があったときに、いま見ているのはその中のどういう動作なのかを認識する研究です。また、「行動認識」ではさらに多くの動作が含まれた映像を与えて、やり投げ、棒高跳び、スイミング、スケートボードといったいろいろな行動のうち、それがどんな行動をとっているものなのかを認識させるというものです。
 また、「画像・映像のキャプショニング(=説明文生成)」に関する研究もおこなっています。これは、画像認識の発展形ですが、認識した画像あるいは映像を人間が日常的に使っている「自然言語」に変換する作業をおこなわせるものです。
 そして、大変興味深い研究のひとつが、VQA(Visual Question Answering)と呼ばれるタスク(=課題、問題設定)です。画像を見せて、文章でクイズを出します。「この画像に何人の人がいますか?」とか、「この画像の赤いジャケットを着ている人の隣には何がありますか?」といったような質問を投げかけると、コンピュータが答えを出す、というようなものですね。こういうやり取りができるようになれば、人工知能が人間にますます近づけるように思います。

玉木先生5

 AIブームと言われるいまは、いわば、研究者が皆でAIの性能を高めていこうとしている時期。タスクはどんどん古くなっていき、より新しく複雑で難しいものが求められます。したがって、こうした研究は、何かを解明したり発見したりするようなものとは違って、世の中に役立つ良いものを作ったり改良したりすることに使われるような「基礎技術」をどんどん作っていこうとするもので、新しいタスクへの挑戦がこれからも続いていくことでしょう。

分からない脳の仕組みに倣うことの難しさとおもしろさ。

 そもそも私が情報工学科を選んで大学に進学した当初のモチベーションは、「人工知能をつくりたい」というものでした。その根っこにあるのは、“人間っておもしろい、なんで人間は見たり聞いたりしたものが分かるのだろう、そういうことが知りたい”という思いでした。知るためには作るのがいい、テレビアニメで観ていたヒト型ロボットのようなものが作れたら、その中身が分かったことになる。そんな興味がそもそもの出発点でした。しかし、小さな頃から、分解はするものの、元に戻せずに壊してしまう私は、ロボット工学には向いていないと分かっていました。そこで、小学校の低学年からやっていたプログラミングだったら、壊れることはないし、ヒト型ロボットの中身や脳の部分を作れることになっていいんじゃないか、そう考えたのです。

 大学では、教養学部の2年間でいろいろな知識を吸収しました。そして3年生になると、待望の「人工知能」の授業があったのですが、その内容があまりにもつまらなくて失望しました。まだその分野が非常に狭かったせいか、こんなもので人工知能はつくれないだろうと思ったものです。しかし、研究室には当時のスパコンと呼べるようなワークステーションがあり、それを先輩たちが全然使わないので、「使っていいですか?」と言ってはいろいろ設計するなどして、コンピュータのおもしろさにのめりこんでいきました。

玉木先生2

 ちょうどWindows95やインターネットが世に出た時代。「インターネットって何? ネットワークって何?」という感じでしたけれども、その研究室は、画像を認識したり、音声を認識したり、CG研究やロボットの研究、福祉工学、ヒューマンインターフェイスなど、なんでもやっているところだったので、大きなコンピュータに本格的に触れる時期とも重なって、研究室に入り浸っていたのが、おそらく今につながっています。
 こうした人工知能の研究というのは、脳の中で何をしているかが分からないのに、それをコンピュータで実現しなければいけないという、まるで暗闇の中をひとりで歩いて行きなさいと言われるようなものです。しかし、顔というものを検出できるような工夫はどうしたらできるのかといったところから、問題設定を置き換えて考え始めて、それを実現に導いていく、そうした工程そのものがおもしろいところだと思います。頑張って試行錯誤を重ねて、たまによい性能が出るようなものにいきつく、そんな難しさこそが醍醐味と言えるのではないでしょうか。
 人工知能の研究に興味があるという人は、ぜひ、次のような勉強をして、うちの研究室をめざして欲しいですね。まず、全般的なプログラミングスキルは必須です。そして、何よりも大切なのは「数学」です。いきなりプログラミングをしてもうまくいきません。そもそも、どういうものを解くべきかというのを分からないままでプログラムを組んでも、何も出ないのです。しかし、数学という武器を知っていろいろ使いこなすと、つまり、微分・積分、確率、行列、線形代数を全部使ってモデル化して、そのモデルに則ってプログラムを書くと、すこぶる良い性能を発揮することができる。だから、数学はしっかり学んでおきましょう。そして、この研究は、スポーツ競技で記録更新を狙う感じに似ていると思うのですが、新しい競技を考えだす人というのも、この分野には絶対に必要です。新しいことにどんどん取り組める若い皆さんに、参加してもらえることを期待しています。

玉木 徹 准教授
Toru Tamaki
ビジュアル情報学研究室 准教授

1996年3月 名古屋大学 工学部 情報工学科 卒業
1998年3月 名古屋大学大学院 工学研究科 博士課程前期 修了
1999年4月~2001年3月 理化学研究所 バイオミメティックコントロール研究センター 研究員
2001年3月 名古屋大学大学院 工学研究科 博士課程後期 情報工学専攻 修了 博士(工学)
2001年4月〜2005年9月 新潟大学 工学部 情報工学科 助手
2005年10月〜2007年3月 広島大学大学院 工学研究科 工学部 助教授
2007年4月~ 広島大学大学院 工学研究科 工学部 准教授
2018年4月~ 広島大学大学院 工学研究科 情報科学部 准教授


up