2020/06/04

ディープラーニングの衝撃-AlphaGoとPreferred Networks-

2016年3月、Google DeepMindによって開発された囲碁AI・AlphaGoが韓国のトップ棋士を破ったというニュースは、非常に大きな驚きを持って迎えられました。

AlphaGoによって白日の下に晒された「ディープラーニング」という概念は、真のイノベーションとして受け入れられ、瞬く間に世界中に伝播していきました。
以来、ディープラーニングのテクノロジーは加速度的な進化を遂げ続けています。

真のイノベーションは、それがなかった時代からは想像もできない距離へと人類を運んでいきます。
ビジネスマンにとっては、その速度にキャッチアップしようとするかしないかで途方もない差がついてしまうことになるでしょう。

今回は、AlphaGoがなぜ画期的だったのかを紐解くことに始まり、そして国内におけるディープラーニングの一つの到達点となっているPreferred Networksの功績を紹介します。

真のイノベーションが世界にもたらす加速度を、正しく認識しておきましょう。

 

AlphaGoの衝撃-モンテカルロ木探索(もんてかるろき・たんさく)からディープラーニングへ-

 

囲碁AIの世界に限って見ても、AlphaGoの登場はこれまでの常識を完全に置き換えてしまうほどに衝撃的なものでした。

何がそれほどに衝撃だったのかということを、囲碁AIの歩んできた歴史から紐解いていきましょう。

 

人間の作った評価関数、しらみつぶしの読み

囲碁AI(コンピュータ囲碁)が最初に登場したのは1960年代のことです。
それから30年以上が経過した2000年前後になって、コンピュータの棋力はようやくアマチュア初段前後のレベルに到達しました。

この時代のコンピュータの特徴は、人間の作った評価関数を用いて局面を評価し、考えられる手順をしらみつぶしに読んで着手を決定するというものでした。

しかし、この手法には2つの面から難がありました。

①着手の分岐が膨大
囲碁は19×19の計361個の交点へ交互に着手することにより進行するゲームで、空いている交点には、基本的にはどこでも着手することが可能です。

そのため、ほんの数手先の局面に限ったとしても、実現可能局面数は天文学的数字になり、コンピュータの計算力をもってしても到底読み尽くせるものではありません。

黎明期の囲碁コンピュータは、評価関数を用いて有効手以外の読みを途中で打ち切るなどして、コンピュータの計算能力を効率的に活用することを試みました。

ところが、評価関数についてはさらに別の問題が存在しました。

②適切な評価関数を作成することが困難
囲碁は、その分岐の多さや、ある種図形的な思考方法などから、人間にとっては非常に感覚的なゲームとして捉えられてきました。
そのため、局面を評価する力、いわゆる「大局観」と呼ばれるものについては、定量的に表現することがきわめて困難でした。

こうした囲碁の特性は、評価関数を利用して大量の手順を読むというコンピュータのアルゴリズムとは相性が悪く、囲碁はコンピュータにとって不得手なゲームと考えられていました。
2000年前後にアマチュア初段前後の棋力に到達したものの、依然としてプロのレベルには程遠く、コンピュータがプロに勝つには100年かかるという人もいるほどでした。

 

CrazyStoneによるモンテカルロ木探索の導入

ところが、2006年に登場したコンピュータ囲碁ソフト「CrazyStone」の登場により、囲碁AIのアルゴリズムの常識がまず一つ塗り替えられます。

CrazyStoneは、旧来の囲碁コンピュータとは異なり「モンテカルロ木探索」のアルゴリズムを採用しました。
モンテカルロ木探索では、考慮局面から終局まで、乱数を用いて自己対戦を無数に繰り返します。
そして、終局時の結果を集計し、最も勝率の高い着手を選択します。

モンテカルロ木探索は、人間が(いわば恣意的に)作成した評価関数による評価とは異なり、勝敗にフォーカスした実績ベースの評価を行います。
この画期的なアルゴリズムにより、CrazyStoneは旧来の囲碁コンピュータから飛躍的な進化を遂げました。

CrazyStoneの登場は、コンピュータ囲碁の世界ではイノベーションとして捉えられました。

2013年、Crazy Stoneは数々のタイトル獲得実績を持つ石田芳夫プロを4子局で破り(アマチュア六段程度)、「このままモンテカルロ木探索のアルゴリズムを(単線的に)改良していけば、いつかプロに勝てる」と信じられるまでになりました。

もっとも、このわずか3年後に世界のトッププロが囲碁AIに惨敗することになると想像していた人はほとんどいなかったことでしょう。

 

AlphaGo-ディープラーニングによる飛躍-

2015年に登場したAlphaGoは、自己対戦を繰り返すモンテカルロ木探索のアルゴリズムを応用しつつ、自己対戦の結果を深層学習により学習・集積するという特徴を備えていました。

従来の囲碁コンピュータを進化させるには、人間の力による改良を行うことが不可欠でした。
しかし、AlphaGoは自動学習により独力で棋力を向上させることができる画期的なプログラムであり、ここに初めてコンピュータが囲碁で人間を上回るための土壌が完成したといえます。

そして2016年、AlphaGoは韓国のトップ棋士である李世ドルとの5番勝負を4勝1敗で制し、瞬く間に人間を凌駕してみせました。

AlphaGoはその後も改良を続けられました。
李世ドルに勝利したバージョンは、プロ棋士など実力者の棋譜(対戦記録)を大量に学習させた状態から自己対戦による学習を開始したため、必ずしも人間の影響を離れたものとはいえませんでした。

しかし、2017年に発表されたAlphaGo Zeroは、人間の棋譜を学習させずにルールだけを教えられた状態から自己対戦による学習を開始し、わずか3日で李世ドルに勝利したバージョンを上回りました。

AlphaGoの登場は、「AI」の呼称を囲碁界にとどまらず全世界に定着させ、アルゴリズムや機械学習に関する常識を一挙に置き換えてしまったのです。

 

Preferred Networks社の急成長とその到達点

 

囲碁AIの世界に大きな衝撃を与えたGoogle DeepMindによる囲碁攻略の試みですが、それは一般社会に対してディープラーニングを応用するためのいわば試金石に過ぎませんでした。

世界中で認知度を拡大したディープラーニングの技術は、その後さまざまなフィールドに対する応用可能性の研究が進み、現在でも熾烈な研究・開発競争が行われています。

国内におけるディープラーニング研究・開発のリーディングカンパニーといえるのが、2014年に設立されたベンチャー企業であるPreferred Networks社です。

Preferred Networks社は、機械学習やディープラーニングに代表される深層学習をはじめとする最先端技術の融合を標榜し、数々の大手企業と技術提携を行っています。

世界各国のユニコーン企業(評価額10億ドル以上の非上場、設立10年以内のベンチャー企業)をまとめたCBINSIGHTS The Global Unicorn Clubによると、2020年5月現在において、Preferred Networks社の企業価値は推計20億ドルとされています。

(参考:「CBINSIGHTS The Global Unicorn Club」
https://www.cbinsights.com/research-unicorn-companies

Preferred Networks社の総社員数が300名前後であることを考えると、この数値は驚異的でしょう。

Preferred Networks社は、真のイノベーションである分野にいち早く取り組むことにより、市場価値を加速度的に高めた好例といえます。

 

真のイノベーションにはいち早くキャッチアップする

 

真のイノベーションが世界にもたらす加速度は、それがなかった時代の常識からは想像がつかないほどに強烈なものです。

そのため、真のイノベーションの前には、旧来の技術・概念はあっという間に陳腐化してしまいます。
世界の潮流に乗り遅れないためには、いち早く新技術を学び、キャッチアップする努力が必要です。

また、真のイノベーションが一度発生すると、一見直接関係がないビジネス領域に対してもさまざまな波及効果を及ぼす可能性があります。
こうした波及効果の兆候を捉えてビジネスチャンスに繋げるためには、自社の直接のビジネス領域でなくても、世界のどこかで真のイノベーションが起こっていないかをキャッチするアンテナを張っておくことが重要でしょう。

【識学からのお知らせ】
リーダーシップが育つロジカルなマネジメント手法を学んでみませんか?
<ご訪問 or Web会議で体験できます>
1000以上の企業が受講した「識学マスタートレーニング」を無料で体験しませんか?
今申込むと『伸びる会社は「これ」をやらない!』書籍をプレゼント

識学マスタートレニングは「学びながら実践」します。
平均して3ヶ月ほどで「売上向上」「離職率の低減」など目に見える成果が上がっています。


お申込み・詳細は こちらお申し込みページをご覧ください