第2回嶋原浩教授

第2回 「明日が昨日になった日 ~囲碁と人工知能~ 」

嶋原 浩 教授

 明日が昨日になるのは何も珍しくはありませんが、ここでいう「明日」はつきなみな「明日」ではありません。それは、グーグル傘下のディープマインド社が開発した囲碁対局用の人工知能「AlphaGo」が、世界トップクラスの実力をもつ韓国のプロ棋士イ・セドル九段との五番勝負に4対1の大差で勝利したという、近頃話題の「例のこと」が起きた日です。

 報道でも大きく取り上げられてはいますが、この出来事の「大きさ」に比べれば、まだまだ小さすぎると私には思われます。その理由の第一は、囲碁というゲームのハードルの高さが尋常ではないということ、第二は、その日が「こんなに早く来てしまったこと」です。今回のコラムでは、この出来事のもつ真の意味について考えてみたいと思います。

 

 まず第一の点について。

 囲碁では「手を読む力」(論理的思考力)に加えて、独特の「感覚」(直感、感性)が重要視されています。序盤から中盤にかけての局面の優劣の判断は、多くの場合、感覚に頼らざるを得ず、トッププロ同士でも見解が分かれることが少なくありません。このため、局面の優劣を判定するための確定的な「評価関数」を求めることは極めて困難であり、囲碁は対局プログラムの「最後の難関」とみなされてきました。

 報道では囲碁は盤が広く、「手の数」が多いからと説明されていますが、これを初手から最後の一手まで読みきることを前提にした説明と解釈したとすれば、それはあまり正しくありません。というのも、チェスや将棋でも、初手から最後の一手まで完全に読みきるということは行われておらず、難易度の違いの説明にはなっていないからです。盤が広いことは、上記のように感覚が必要になることの、原因の一つです。

 今回トッププロに勝利したAlphaGoは、この「感覚」を模擬対局を繰り返すという自己学習によって身に付けたそうです[1]。これはまさに人間が、経験によって感覚を研ぎ澄ますのに似ていますが、人工知能は人間よりもはるかに高速にこれを行うことができ[2]、また学習したことを忘れることもありません。おまけに、なぜその手が良い手なのか、人間には理解できないという不気味さです。囲碁の世界に限っていえば、すでに人工知能は人間よりはるかに優れているといえましょう。

 囲碁愛好家なら理解してもらえると思いますが、私は囲碁には「人の世の縮図」といった趣があると考えています[3]。それは「読み」の部分ではなく、「感覚」の部分においてです。「人生の縮図」と表現する人もいます。「縮図」、すなわち簡単化したモデルにおいてこれだけ有効なら、将来現実の世界でも人間を凌駕する素養は十分にあるに違いありません。これは、映画「ターミネーター」の「Skynet」を想起させる出来事です[4]。人類は新しい世界に足を踏み入れつつあると思います。

 しかし、私はこの事件をポジティブに受け止めています。「機械 対 人間」の構図でとらえる意見もありますが、私にはむしろ「人類の大勝利」に見えたのです。なぜなら、この人工知能を開発したのは、紛れもなく人類だからです。AlphaGoの開発者はもちろん、人工知能をここまで発展させたすべての科学者・技術者に敬意を表したいと思います。(その基礎には「物理学」があることにも、ここでさりげなく触れておきましょう。)

 

 次に第二の点について。

 よく「加速度的な技術革新」という言葉が使われますが、それでもまだ生易しすぎる表現に思われます。というのも、加速度自体がどんどん増加しているように思われるからです。むしろ「指数関数的」というべきでしょう[5]。高校の数学で習うように、指数関数は何度微分しても指数関数になります。つまり加速度も指数関数的に増加しているというわけです。

 私はどこにでもいるようなアマチュアの囲碁愛好家ですが、10年ぐらい前には、あと40年ぐらいはコンピューターに自分が負けることはないだろうと思っていました。その推察は、当時の囲碁ソフトとの対局から受けた感触に基づくもので、感覚としては、順当だったと思います。ところが、この推察は見事に裏切られ、一昨年、予想より30年も早く、私は市販の囲碁ソフト[6]に負けてしまったのです。これは個人的には今回の事件よりも衝撃的なことでした。

 そしてまた、その時点でも、「プロ棋士を負かすプログラムが出現するのは、早くみても10年以上は先だろう」と感覚的に思っていました。しかし、今回その予想も見事に裏切られてしまったというわけです。

 このように、私の感覚に基づいた予想は、ことごとく裏切られてしまいました(専門家の予想も裏切られたそうですが)。しかし、このことは、人間の頭脳は文明社会が出来る以前の時代の、進化の産物であるということを思えば、当然かもしれません。そのような時代では、およそ一定の速度で走る動物や、せいぜい崖から等加速度運動で落下する岩などは目にしていても、加速度自体がどんどん増加するような運動を目にすることは殆どなかったに違いありません。そのような急激な変化を人間が感覚的に理解したり予想したりするのは、生物学的に難しいのではないでしょうか。

 そもそも人間が感覚に基づいて物事を予想するときには、大概は、過去の出来事に照らしてみて、経験的に予想するものです。それは単純に接線を延長するようなことですから、関数でいえば一次関数、図形でいえば直線です。指数関数的な変化を見せる、近頃の技術革新の前には、このような経験的・感覚的な予想は全く無力といえます。

 ちなみに、私見ですが、真のブレークスルーは、今年の3月ではなく、昨年10月、AlphaGoがあるプロ棋士に勝利した時点ではないかと私は思っています[7]。実は当初、このコラムはそのことをネタに書くつもりでした。実際、(人工知能がトッププロに勝つことが)「明日起きても不思議はない」という予想も書いていたのですが、完成原稿を提出する前に、イ・セドル九段が破れたというニュースが飛び込んできてしまったのです。のんびり書いているうちに、あっという間に「明日が昨日になってしまった」というわけです(それをタイトルにしました)。

 予想は的中しましたが、それは以前のように感覚に基づいた予想ではなかったからでしょう。トップクラスではなくともプロ棋士の一人に勝ち、その自己学習の手法の有効性を証明したAlphaGoが、トッププロに勝つのは(論理的に考えて)明らかに時間の問題でしかありませんでした。なにしろ、時間さえあれば(ものすごい速さで)いくらでも自己学習し(「機械学習」という)、いくらでも強くなれるわけですから[8]。ニュースを聞いて、書き終わった原稿を捨てざるを得なくなったことは言うまでもありません。

 

 結び。

 かくして、いまさらながら科学技術の進歩の速さには驚かされるというベタな話に帰着するわけですが、その程度たるや、30年前、10年前のそれとは「異次元のものである」というのが、私の思うところです。

 科学技術の進歩は、世の中(社会)の変化をもたらしますが、その急激さに、生物学的には何万年も前から大して進化していない我々人間の頭脳(とくに日本の政策を立案する人々の頭脳)は対応していくことができるのでしょうか[9]。不安を覚える今日この頃です。

 

(以上)

 

脚注・補足

[1] 深層学習(deep learning)と呼ばれる手法を用いているとのこと。人間の脳の構造をソフトウェア的に模倣しているようです。

[2] 聞くところによると、AlphaGoは、3000万局の自己対局(いわば自己研鑽)を行ったとのことです。人間は頑張っても一日に大体10局打つのが関の山でしょう。仮にものすごく頑張って年間6000局打ったとしても、3000万局になるには、5000年かかることになります。5千年前といえば古代エジプトが始まったころです。

[3] 戦国武将や経営者に囲碁の愛好家が多いことはよく知られていますが、それは現実の世界の戦略や経営の機微が、囲碁の駆け引きのそれに通じるものがあるからだといわれています。ちなみに、囲碁愛好家として知られているのは、戦国武将では織田信長、豊臣秀吉、徳川家康をはじめとして無数、経営者ではビル・ゲイツ、スティーブ・ジョブスなど、枚挙に暇(いとま)がありません。近頃話題の実業家では広岡浅子も囲碁愛好家として有名です。ちなみに、物理学者にも囲碁好きは多いのですが、その話は別の機会に譲りましょう。

[4] 1991年公開の映画「ターミネーター2」によれば、1997年8月4日に稼動を始めたSkynetは、尋常でない速さで自己学習を重ね、1ヶ月もたたない1997年8月29日(映画の中では"The Judgement Day"と呼ばれている)、ついに自我に目覚め、人類抹殺を始めます。

[5] 私はパソコンが世の中に出回ったころから、手持ちのパソコンの代替わりのたびに、計算速度を測定してきましたが、その結果、その速さはほぼ指数関数的になることに気づきました。指数関数的に技術が発展するのは、技術開発にその時点での技術を利用しているからでしょう。これは簡単な微分方程式で示すことができます。技術水準を変数xで表すと、技術開発にコンピューターを利用する状況は、Δx = (v + c x) Δt という数式で表され、これを解けば、指数関数が得られます。ここで、vは生身の人間の能力、cは人間がコンピューターを含むそれまでの技術を利用する程度を表す定数です。また、いずれは、技術開発の仕方自体を人工知能が教えてくれるようになるかもしれず、そうなれば、数式は、Δx = [ v + (c + α[x] )x ] Δt となりますが、この解は大概の場合あるtで発散します。α[x]は「研究者としての人工知能」の腕前に関係した未知の関数です。

[6] フランスのレミ・クーロンによって開発された囲碁ソフト「Crazy Stone」。物理学でもおなじみのモンテカルロ法を用いているそうです。2013年にトッププロ(石田秀芳二十四世本因坊)に四子局で3目勝ち、アマチュア六段以上の実力といわれています。これも一つのブレークスルーでした。ちなみに、日本の囲碁界では、プロとアマチュアでは段位は別です。プロ棋士の初段は、一般のアマチュアの高段者よりもはるかに強いようです。

[7] その経緯は、D. Silver et al., Nature Vol.520, 484 (2016). に記事があります。Natureといえば一部の学者が泣いてありがたがる雑誌(商業誌)です。

[8] もちろん、この話の背景には、グーグル社がAlphaGoの自己学習に、自社のコンピューター(クラウドコンピューティングという話も報道されていた)をふんだんに使わせたということがあります。上では科学者・技術者に敬意を表しましたが、「囲碁の対局ソフト」の「真の価値」を理解していたグーグル社にも敬意を表したいと思います。このことに「日本」が一枚も噛んでいないことが、非常に残念です。少なくとも日本政府は「囲碁」についても、「人工知能」についても、真の価値を理解していなかったのではないでしょうか。

[9] 気になる例としては、「英会話政策」と「原子力政策」があります。  英会話については、大学でも英会話力の目標を設定したりして、「一億総ペラペラを目指しているのか?」と思われるような涙ぐましい努力が行われています。この国策は、「英会話振興」を越え「英会話信仰」になっていると思われるほどですが、日本語・英語間の自動通訳の人工知能が開発されれば、その大部分は必要がなくなります。政府は「英会話振興」に注力するよりも、1兆円ぐらいかけて自動通訳の人工知能の開発を加速するほうがはるかに効率的ではないでしょうか。  原子力についても「古い常識」に基づいて政策が考えられているような気がします。指数関数的な技術革新の速さを考慮すれば、例えばソーラーパネルの性能向上に力を入れるほうが賢明ではないでしょうか。

 

2016年3月31日掲載


up