2019-02.マテリアルズインフォマティクス(MI)成功のカギはRPA?

 来月から新年度。どの会社も新年度に新しい取り組みを進めるケースが多いだろうが、私が携わる素材・化学系の多くの企業において「待ったなし」になると考えているのが「マテリアルズインフォマティクス」。

 

■マテリアルズインフォマティクス(MI)とは

 マテリアルズ・インフォマティクスとは「データマイニングなどの情報科学を通じて新材料や代替材料を効率的に探索する取り組み」

(出展:マテリアルズ・インフォマティクス:株式会社日立総合計画研究所

 

 この動きは2011年にアメリカのオバマ政権時のMGI(Materials Genome Initiative)プロジェクトに始まる。そこから今に至るまでの歴史に関しては、以下のリンクが詳しい。このクオリティの資料が無料で閲覧できるって素晴らしい。

https://www.jst.go.jp/crds/pdf/2013/SP/CRDS-FY2013-SP-01.pdf

 

■今までの研究開発とどう違う?

 今までの研究開発の流れを乱暴に簡素化すると

①「(〇〇という仮説から or なんとなく)これがいいのでは?」と思って作り、

②作ったモノを調べてみるとダメで(上記仮説が間違っていると気付き)、

③また「じゃあこっちの方がよいのでは?」と思って作り、

④やっぱりだめで・・・の繰り返し

 

 これが100個に1個、1000個に1個しか当たらないという世界。製薬業界ではこの確率がさらに下がり、時代とともにその確率がさらに下がり続けている。よって製薬業界では自社開発を続けるのに加え、既に有望な候補材料を発掘したベンチャーと連携する方が合理的となる。

 

 MIは上記の様に新しいモノに一目散に飛びつく前に

①それまで蓄積した「モノ」と「実験データ」を集め

②「人間が思いつかない/まだ気づいていない相関」を見出し

③その相関を元に、提案されたモノの中からよりよい候補を選抜する、という流れ。

 

 これまでの研究開発と比べるとなんだかちょっとスマート。この取り組みが本当に機能するなら、従来の研究開発は不要になると直線的に考える方が多い。実際にこの1年での多くの大手化学・素材会社はMIへの取り組みを明文化している。

 

●三菱化学:マテリアルズ・インフォマティクス Center of Excellence (CoE) の発足について(2018 年 6 月 27 日)

https://www.mitsubishichem-hd.co.jp/news_release/pdf/00695/00779.pdf

●富士フイルム:人工知能技術の研究開発組織を設置(2018年7月9日)

https://www.fujifilmholdings.com/ja/news/2018/0709_01_01.html

●住友化学:2019~2021年度 中期経営計画を策定(2019年3月12日)

https://www.sumitomo-chem.co.jp/news/detail/20190312.html

 

 日経エレクトロニクスでも昨年特集を組んでおり、上記の流れが一層早まったのではと考えている。

待ったなし!AIで材料開発 | 日経 xTECH(クロステック)(2018年10月号))

 

■で、MIはうまくいくの?

 このMIが今年、来年、再来年に実用化されるなら今化学を学んでいる学生は、今からでも遅くない、異なる分野を学んだ方がよい。

ですが話はそう簡単ではない。個人的に感じているMIの課題として

 

①それまで蓄積した「モノ」と「実験データ」を集め

→データ数はどれくらい必要?実験データは5年前と今で測定条件は同じ?(前提条件はそろっている?)

 

②「人間が思いつかない/まだ気づいていない相関」を見出す

→本当に相関が見つかるか?その相関は正しいか?事実と異なる相関を真実だと捉えると、それ以降の取り組みは全て的外れになる

 

 ①だけでも課題山積。特に①のデータの前提条件の問題は根深く、同じ材料であっても企業間でも測定条件が異なるし(それが秘密情報で未来永劫開示できない場合もあるし)、大学でも時代と装置が変われば測定条件が変わる可能性がある。

 さらにそれらを検証する人がいないと、そのデータセット自体が危なっかしい。機械学習の分野でいわれるデータクレンジングがMIの世界でも必須。

 私はこの①の段階でMIは無理筋では?と思っていましたが、以下のような会社間を跨いだ取り組みも始まっており、難しい点もあると思いますが心から期待しています。

 

●NIMS・三菱ケミカル・住友化学・旭化成・三井化学、オープンプラットフォームの運用に関する覚書に調印 

https://www.nikkei.com/article/DGXLRSP448512_Z10C17A6000000/

 

■じゃあMIの一番の問題は?

 超絶前置きが長くなったのですが(今までが前置きかよw)、私がMIで一番課題だと思っているのが③です。③のどこが問題でしょう?

 

③その相関を元に、提案されたモノの中からよりよい候補を選抜する

 

 

ずばり「提案」。

 

これ、「誰が」提案するの?

 

 先の日経エレクトロニクスの記事をむさぼるように読んで気付いたことがあった。それはMIの成功例の9割が、電池電極材料を始めとする「無機材料」であったこと。私は無機分野は専門ではないですが、無機材料には

 

❶無機元素の結晶から成り、元素同士に固有の相性があるため結晶の種類が限られ、結果として最終的な選択肢は「有限」になる

❷結晶で発現する特性が無機材料の特性の大半を支配する

 

といった特徴がある。一方で有機材料は、

 

❶無機元素と同様に元素同士の結合に制限はあるが、結合「箇所」が膨大で、選択肢が「無限」になる

❷有機材料は結晶だけで特性発現するものは少なく、例えば膜にすることで電気が通ったり、色が出る等の特性が発現する。そこで成膜時の材料の配向や安定性、他の材料とのすり合わせ等、追加すべきパラメータが多い 

 

という傾向がある。

 

 私が最も課題と思っている「提案」に話を戻す。

 無機材料はその選択肢が有限であるため、計算対象材料を自動的に生み出す自動発生が可能。一度自動発生ができればそこから特性値を予測し、さらに特性値を上げられるような次の候補材料を自動発生させ、予測するというサイクルをコンピューター上で365日回せる。

 こうなると人間が思いつかない組み合わせや発想を、MIから導くことは可能性が高くなると思うし、実際に成果も出つつある。

 一方で有機材料は、2019年3月時点、この自動発生がまだできないというのが私の理解。このプロセスを人間に頼ってり、これならいくらMIを使っても驚く選択肢は出てこない。だって提案は人間がしているんだもの汗

 

 有機材料へのMI導入はこの自動発生が肝なんじゃないか?と最近実感するようになりました。どこかで「有機材料の自動発生」に取り組んでいないかなあと思ったら、この取り組みって、巷でホワイトカラーの仕事を奪うと言われているRPA(Robotic Process Automation)そのものじゃないか?と思うようになりました。

 

 今まで研究に関係ないと思っていたけど、研究開発とRPAって相性いいのかも?と初めて実感。この取り組みを行っている組織があればその動向をウォッチしながら、その仕組みを使う側に回るべく、準備したいと思います。