プロフィール
2010年東京大学情報理工学系研究科博士課程修了(情報理工学博士)。2006年東京大学大学院在学中に、西川徹等仲間6名で、自然言語処理・機械学習技術分野で事業を行う株式会社Preferred Infrastructureを創業、2014年に深層学習技術の実用化にフォーカスした株式会社Preferred Networks(PFN)を創業。代表取締役 最高研究責任者として、PFNの研究開発をけん引している。材料探索分野の汎用原子レベルシミュレータMatlantisの販売を行う子会社として2021年に設立された株式会社Preferred Computational Chemistryの代表取締役社長を兼務。
深層学習(ディープラーニング)は人工知能領域における技術のひとつです。産業界だけでなく医療、金融、サイバーセキュリティなどさまざまな領域で応用が進み、自動運転や生産技術、宇宙技術などにも革新的な成果を生み出し続けています。
岡野原大輔氏は、この深層学習技術に強みを持つ株式会社Preferred Networks(以下、PFN)の共同創業者であり代表取締役 最高研究責任者として最先端技術の開発を先導し、現実世界の課題解決につなげてきました。PFNはソフトウェアのみならずロボティクスやプロセッサといったハードウェアまで手がけているユニークな存在であり、岡野原氏は次世代の研究者・技術者に多大な影響を与えている、情報学研究者の憧れの的です。
境界領域にいることが
自分のユニークネスの源泉
――岡野原様の研究テーマはどのような興味や関心から育まれたものでしょうか?
私の研究テーマは、情報と知能に関する数理と応用です。最初は小学生のころにデータ圧縮に興味を持ち、情報を数学的に解いていく情報理論、情報を処理する知能について考えるようになりました。大学に入ってからは自然言語処理分野、深層学習(ディープラーニング)を中心とした人工知能などの周辺分野に興味が広がっていきました。また、抽象的な理論だけではなく、情報や知能を現実に具体化していくことに興味をもつようになり、アルゴリズムやデータ構造なども研究するようになりました。一見すると異なるように見える現象や課題が、共通の理論や手法で解けることに感動を覚え、はまり込んでいきました。
――さまざまな分野の技術や知識を掛け合わせることで違うものが見えてくるということですか?
そうですね、まったく別なものを組み合わせたり、関係ないことをしたりするのが昔から好きでした。高校まで部活でラグビーをやって花園にも行きましたが、その一方で研究も続けていました。そういうポジションが好きなんです。「研究」と「ビジネス」も同じで、博士号をとって国際学会にも出たりする研究者でありながらビジネスもやる人は少なく、どちらから見ても言わば異端児なのですが、そういう境界領域にいることが自分のユニークな部分だと思っています。
天才たちが立ち上げて
世界の変革を目指し始めた
――PFI(Preferred Infrastructure)創業時のお話を聞かせてください。
PFIを立ち上げたのは大学修士1年だった2006年のことでした。PFN(Preferred Networks)の共同代表者でもある西川徹とは大学1年からの付き合いでした。大学時代は「未踏ソフトウェア創造事業」に採択され、国から支援をもらってプロジェクトを進めていました。大学4年になると未踏事業の同期で起業する人が多く、西川がプログラミングコンテストで意気投合した東大と京大の代表チームや、共通の友人6人が集まって会社を始めました。コンピュータサイエンスが得意なメンバーで何か製品を作ることを始めたわけです。
――創業メンバーはどのような方たちだったのでしょう?
いわゆる天才だと思います。たとえば京都で宇宙物理学の研究をしていた村主崇行さんは、かなり早い時期から「GPUが来る」と予測していた人です。のちにPFNがスパコンを開発したのも彼がいたからです。また田中英行さんは、いわゆるコンパイラを一から書いたり、ゲーム機のシミュレータを作っていたりしていました。京大にいた𠮷田悠一さん(現・国立情報学研究所)はプログラミングの世界でも研究の分野でも伝説的な人です。西鳥羽二郎さんはアルゴリズムに強く、創業時のメンバーは皆それぞれ得意分野がありました。創業半年後には、後にトレジャーデータを立ち上げる太田一樹が加わり、CTOになりました。
そういうメンバーで製品を作ってお客さまに納品していたのですが、ビジネスの専門家はいなかったので、ビジネスとして事業化していくまでには時間がかかりました。
――「現実世界を計算可能なものにする」というPFNの理念はどのように生まれたのですか?
私は学生時代に米Googleでインターンをしていました。コンピュータ技術を使って世界に通用するプロダクトがどのように作られているかを目の当たりにして、技術で世界を変えていくこと、そしてそれをビジネスにしていく過程とその大変さを見ていきました。PFIのビジネスがまだ軌道にのっていなかった頃、Twitterの方やCiscoのフェローが「世界はテクノロジーで変わる」と言っていたのが印象深く残っています。また、ソニーの久夛良木健氏には「何を小っちゃいことをやっているんだ。もっとクレイジーなことをやれ。世の中を変えるんだ」と発破をかけていただき、強く影響を受けました。テクノロジーで世の中に貢献することを考えるようになりました。
AIのブレークスルーの波にのり
フレームワークをリリース
――PFNを立ち上げた経緯について教えてください。
2012年にAI分野で深層学習(ディープラーニング)というかなり有望な技術が見えてくると同時に、コンピュータが小型化し、Ciscoなどの企業がIoTやIoEに取り組み始めました。
この二つにフォーカスするために2014年にPreferred Networksを立ち上げました。
ただ、当時のAIは、「今さら」と言われるようなものでしたし、IoTも具体的にどんなビジネスにつながるかが見えておらず、広く世の中に受け入れられたとはいえない状況でした。
――当時、AI分野でどのようなことが起こったのですか?
それまではAIの実用分野はまだ限られていて、画像認識なども一般の人が期待するような精度ではありませんでした。
ところが2012年に、深層学習(ディープラーニング)を使ったシステムが画像認識や音声認識に大きなブレークスルーをもたらしたことがTwitterなどで話題になり始めました。さまざまな批判を受けながらメインストリームではないところで地道に研究されていた深層学習(ディープラーニング)がようやく花開き、世界がものすごい勢いでそれを使うようになりました。当社もチームを作って学び始め、「Chainer」というOSS(オープンソースソフトウェア)のディープラーニングフレームワークを2015年に公開しました。今もChainerで培った技術が、世界中の研究者や企業が使っているPyTorchに受け継がれています。
ロボティクスから
スパコン開発まで
――その後のPFNのマイルストーンとなった成果をご紹介ください。
ロボティックスに注目したのは、ファナックとの協業によるもので、ロボットの知能化に取り組み、最初はバラ積みのピッキングロボットの開発を行いました。
次に、家庭でもロボットが使われる未来を見据え、トヨタ自動車の生活支援ロボットHuman Support Robotを活用した「全自動お片付けロボットシステム」をCEATEC 2018でデモ展示しました。ロボットが散らかった部屋を片付けるシステムです。家庭で働くロボットを製品化するには、コストや安全面でまだまだ技術のブレイクスルーが必要です。
一方で、AI技術の発展のためには計算力の増強が必要でした。そこで中長期的に投資して深層学習を高速化するディープラーニング向けアクセラレーターMN-Coreの開発や専用のスーパーコンピュータの開発も進めました。これは、大学時代にスーパーコンピュータを研究し、平木敬先生や牧野淳一郎先生と「GRAPE-DR」という天体シミュレーションを高速化するプロセッサーを作った西川や、村主さんの貢献が大きいです。その当時のチームメンバーで開発したMN-CoreやスパコンMN-3は、2020年6月から2021年11月までの間、スーパーコンピュータの省電力性能の世界ランキングであるGreen500で世界1位を3度獲得しました。
そのプロセッサーやスパコンをどのように使って課題解決していくかを考えることが、今の私の役割で、アプリケーションを開発したり、スパコンを活用して競争力を生み出すにはどうすればいいかを考えたりしています。
――直近の最も大きなプロジェクト「Matlantis」について教えてください。
材料科学の分野でもディープラーニングが使えるのではないかと考え、量子化学を考慮したシミュレーションに応用できるという仮説を立てました。
次世代電池を作ったり半導体を設計したりする際には今でも実験が主導しており、実際に材料を作ってから性能を評価しています。個々の材料特性をシミュレーションするには非常に大量の計算が必要です。「計算化学」というのですが、そこで我々はまず大量の計算化学の計算結果を第一原理計算を用いて学習データとして作り、それらを使って原子や分子の構造、性質を高速にシミュレーションする「PFP」というモデルを作りました。
従来の材料化学の考え方は、非常に限られた問題に対して専用のモデルを作るか、限られた問題で実験データを集めて専用のモデルを作るというものでしたが、我々が目指したのは、さまざまな検証を網羅的に扱える汎用的なモデルを作ることです。それには非常に大量の学習データが必要になりますが、PFNはスパコンを作っていますから、大量のデータを作ることができました。
また、作った訓練データを使って結果を予測できるモデルを作る必要がありました。PFNは「Chainer Chemistry」という化学向けのグラフニューラルネットワークを元々作っていました。こうした研究分野の延長線上に原子レベルシミュレーションを行うために必要な結果を高速に予測できるモデルを作ることができました。
こうしてENEOSと共同でMatlantisを開発し、製品化・サービス化を進めて2021年7月にSaaSとして公開しました。公開から1年半ですでに40以上の企業・大学・研究団体で正式利用されており、我々の予想より圧倒的に早いペースで、多くの方に使っていただいています。
――材料検索にMatlantisを使い、非常に速くて、自由度が高くて拡張性があるとユーザーが語っているYouTube動画を見ました。
我々が提供しているのは、材料開発の根幹にある「これさえ解ければあとはいろんなことができる」という一種の支配方程式です。たとえばレアメタルを使わずに、さまざまな材料・素材で同じ性能を達成できる触媒や電池を探したりすることができます。使う方にとっては自由度があるんです。AIでは特定の問題に特化したモデルを作ることが多いのですが、Matlantisを使えば、原子のシミュレーションに必要な根幹部分だけを高速かつ正確に推定できるので、目的に応じて何十、何百のアプリケーションを作ることができるのです。
社会のクリティカルな課題を
解決していくために
――今後の課題は何でしょうか?
AIはまだ学習効率が悪く、人間のように一、二例を見ただけでは学習できません。人間ならゾウの絵を見せれば動物園のゾウを見分けることができますが、今のAIにはそういうことはできず、たくさんのデータを用意して学習させなければなりません。しかし世の中のクリティカルな問題には、そもそもほとんど学習データがないことが多々あります。
たとえばヘルスケア領域では、実際の症例をもつ人が少ない病気があります。そのように学習データが少ない場合、言い換えれば、非常に汎化した問題設定を今のAIではできません。ですから今後取り組んでいきたいのは、それを解決できる手法理論の解明です。
ひとつは計算・AIのモデルを100倍、1000倍にしていくという方向です。「機械学習のべき乗則」というものがあり、ある条件でデータとモデルを大きくしていけば、性能はどこまでも上がり、より多くの問題を解けるようになります。次の単語を予測するという言語モデルでは、世界最速のスパコンの10倍の計算量を使って学習したモデルで大学受験の問題を解いたりしており、さらに大きくすればもっと難しい問題も解けるといわれています。しかし計算機の性能にも限界があるし、すでに世界のWebをクローリングし続けて学習しているのですから、それ以上に多くのデータは増やせません。ですから学習効率を上げるしかないのです。
――今後どのような研究を進めたいですか?
AIはまだ黎明期です。半導体やトランジスタが出てきた当初は使い途がわからず、ラジオやテレビが発明されるまで十年ちかくかかりました。AIも今はまだできないことが多く、最適な使い方が見つかっていませんが、いろいろなことができるようになれば、今はまだ存在しないような製品・サービスも出てくると思います。
先ほどAIがどこまで人に追いつくかが課題だと言いましたが、すでにコンピュータのほうが人より優れている分野もあります。コンピュータの計算力や正確性と人間の能力を組み合わせれば、これまで人が解決できなかった難しい課題を解決できるかもしれない。実際に、将棋や囲碁では、これまで人がとらわれてきたバイアスを取り除き、思いもよらない手で人間に勝っています。ただし限界のある計算機に比べると、人間というハードウェアや想像力は圧倒的に効率がよいので、今、コンピュータやインターネットを使いこなして仕事をするように、将来的にはAIを使いこなせる人間が増え、AIと人間が協調して問題解決していくようになるでしょう。人間の能力を伸ばしていくという観点からもAIの未知なる可能性に興味があります。
爆発的に増える情報の中で
後進のキュレーションを果たす
――次世代の研究者や技術者の育成のためにしていることはありますか?
できるだけ社内で多分野の人が情報共有できる環境を意識して用意しています。たとえばロボットの研究成果がヘルスケア分野で画像認識に使えたりするように、まったく別分野で使えることはよくあるので、分野間の交流を増やしています。
またこれは半分自分のためでもあるのですが、最先端の研究論文を毎日読んでTwitterで発信しています。アウトプットすると自分自身が学べるというのと、それに興味をもってくれた人とつながれるという利点があります。
研究の仕方も変わりました。インターネットが使えるようになるまでは、海外の論文は、誰かが現地の図書館に行ってコピーし、それを持ち帰って研究会などで配られたりするものを読むしかありませんでした。今はインターネットですぐにソースコードまで取れます。論文や研究結果、ソースコードがTwitterやGitHubで公開され、誰かがインパクトのある研究成果を出せば、世界中の研究者が1週間後にはそれを追試してモデルを公開しています。非常にオープンで、スピードも速くなっています。
情報は爆発的に増えていますから、どの情報が重要で、そうでない情報はどれかというキュレーションが重要です。さまざまなコミュニティで、情報の選別や評価の議論がされていますから、私もPFNのテクニカルアドバイザーの先生方や世界のいろいろな方々とミーティングして情報交換し、新情報を社内外に提供しています。
――最後に、今回KDDI Foundation Awardを受賞されたご感想を教えてください。
このような賞をいただき大変光栄です。受賞を「もっと頑張れ」という励ましだと捉え、今後も一層精進し、少しでも世の中に貢献していきたいと思います。