マテリアルズインフォマティクスとは?AI開発者が実装方法まで解説

プログラミング

どうも、リンです。

超大手世界的自動車メーカー勤務→AIベンチャー出向中でAI作ってます。

 

以前、このようなツイートをしました。

 

「マテリアルズインフォマティクス」

聞いたことがあるでしょうか?おそらくないでしょう!

 

プログラマーや化学者はもちろん、全くの素人でもその内容を聞けば「面白そう!」と思うでしょう!

そこで今回は、「マテリアルズインフォマティクス」とは何かを紹介していこうと思います!

スポンサーリンク

マテリアルズインフォマティクスとは?

ではまず、「マテリアルズインフォマティクス」という言葉の意味ですが、

マテリアルズ‐インフォマティクス(materials informatics)


コンピューターによる情報科学の手法材料科学に取り入れた学問分野。データマイニング人工知能を用いることで、さまざまな材料を組み合わせて繰り返し実験を行う従来の手法に比べ、新規材料や代替材料の探索などを効率よく行うことが可能となる。MI材料情報科学

コトバンク:https://kotobank.jp/word/マテリアルズインフォマティクス-1997138

となっております。

つまり、「情報科学×材料科学」ということです!

 

全く別物の科学に見えるけど、組み合わせるってどういうこと?

と思われるでしょう。

情報科学と材料科学、この二つが組み合わさるとどのような効果が生まれるのでしょうか?

マテリアルインフォマティクスの目的

情報科学×材料科学であるマテリアルズインフォマティクス

その目的は何なのでしょう?

答えは、「架空の実験室を作る」ことです。

 

新しい材料を開発するためには、膨大な設備が必要です。

  • 大量の試薬
  • 高価な実験機器・測定機器
  • 人件費

などなど・・・

このような費用は大きなリスクとなります。

 

ではもし、シミュレーションで大まかな開発指針を立てれるとしたら?

材料開発にかかる費用が大幅に削減できるでしょう。

だから情報科学を活用するのです。シミュレーションによって架空の実験室を作ることで、材料開発をより安く、より効率的に行うことができます!

 

「マテリアルズインフォマティクス」の目的は「架空の実験室を作る」こと。

意味がお判りいただけたでしょうか?

マテリアルズインフォマティクスの成功例

少し前に、Youtubeでこのような動画が投稿されました。

国立研究開発法人物質・材料研究機構NIMSによる

「AIを使って、世界最高性能の断熱膜を作る」という研究です。

 

材料開発は、いくつかの素材の組み合わせで良い材料を作り出すというアプローチをします。

ではもし、1000種類の材料と500種類の材料を組み合わせて最高性能の材料を作りたい場合は

500000通りの実験をする必要がありますよね。

現実的ではありません。

 

そこでAIを使うのです。

それぞれの材料の基礎データと、実験から得たデータをもとにして

「材料基礎データの○○ってパラメータが、性能の良し悪しを決めるんじゃないか?」

という予測をAIで立てるわけです。

 

そしてAIをまた使って、

「材料125番と材料832番を組み合わせると一番性能が良くなるのでは?」

と予測を立て、実際に実験で作ってみるという手法ですね!

 

これならばムダな実験を省くことができます。

 

逆に、「○○という性能を出したい」→「AIで計算」→「材料Aと材料Bを組み合わせる」というように、性能から逆算して材料を用意することもできますよ。

 

マテリアルズインフォマティクスは、かなりポテンシャルに富んだ手法ですよね!

動画の中身では「アンサンブル回帰木という手法を使って…」とありますが、ランダムフォレストという機械学習ですね。私としてはなじみ深い技術です。

「AIでぱっとやりました!」みたいに解説されているけど、データ収集とかおそらくメチャ大変だっただろうなぁとシミジミしますね。

マテリアルズインフォマティクスの問題点

計算手法が研究途上

マテリアルズインフォマティクスは未だ研究途上の技術です。

「この計算をすれば上手くいく!」という絶対的な計算はありません。

  • 材料のパラメータをどう加工するか
  • 計算手法はどうするか
  • 膨大な計算コストをどう下げるか
  • 計算のブラックボックス化をどうするか?

この4つは、マテリアルズインフォマティクス最大の関門でしょう。

 

材料科学者と、データサイエンティストが試行錯誤の続けて作り上げる技術ですが、

データサイエンティストの人数は少ないのが現実です。

 

これからデータサイエンティストが数多く生まれて、マテリアルズインフォマティクスのような分野で活躍して頂くことを期待しています!

綺麗で大量の基礎データが必要

マテリアルズインフォマティクスを始めとする情報科学の分野では、

「欠陥が無く綺麗で、大量のデータ」が必要になります。

しかしそのようなデータは、企業も研究所も持ち合わせていないことが問題です。

 

今、世界中の研究機関が「材料の基礎データ」を揃えようとしています。

現時点では、まだまだ少数のデータしか用いることができないのは、マテリアルズインフォマティクスの大きな問題点と言えます。

 

今後、データベースが進化していくことに期待です!

化学反応の世界は未知が多い

例え、材料の基礎データが数多く揃っても「化学反応の世界は未知の部分が多い」ことは大きな問題点です。

「AIで予想した値と全く違う結果になる」ということも起こりえます。

 

仮に新たな化学の知見が揃ったところで、そのような複雑なモデルをAIに取り込むことができるのでしょうか?

 

正確な予測は、まだまだ難しいです。

もっと知りたい方へ

マテリアルズインフォマティクスに興味を持たれた方に、オススメの書籍を紹介します。

 

申し訳ありませんが、まずは私の書籍の紹介です。

追記:機械学習完全マスター教科書販売中です980円[期間限定]:24350文字の教科書です)

  • Pythonガチ初心者がインストール~機械学習を実装できる
  • マテリアルズインフォマティクスを題材とした実装講義付き
  • 動画内で出てきた「アンサンブル回帰木=ランダムフォレスト」の原理解説・実装
  • 更にその先を行く最新技術「LightGBM」の原理解説・実装

などなど、この記事の読者好みの1冊となっております。

研究や仕事でマテリアルズインフォマティクスを使いたい方にはピッタリなんじゃないですかね?

pythonの一般的な教本と一味違い、

  • 第一に機械学習を最短経路で「実装」できる
  • 第二に詳しい原理が理解できる

これらを重視して執筆しました。

普通の教本の1/4くらいの値段ですし、誰かに紹介すれば半額の紹介料が入るのですぐ元は取れます

★★★★★この価格でこのクオリティは凄すぎる

大学生ですが、これをつかって実験のレポートのデータ解析などにもつかえそうだと思いました! また、値段が安すぎて恐縮してます汗 凄すぎる…

レビュー欄より

★★★★★ 数ある教材の中でもトップクラスの分かりやすさ

これを機会に一度挫折したpythonを学び直そうと一念発起いたしました。いろいろなお勧めサイトの教材を拝見し購入しては失敗していましたが、ようやく超優良教材見つけました。知りたかった情報がすべて網羅されていて、この価格はなかなか無いと思います。今後の追加情報も期待したいです。

レビュー欄より

↑こんなコメントも頂きました!ありがとうございます(泣)

お役に立てて、必死に執筆した甲斐がありました(泣)(泣)

レビューはモチベに繋がるので、順次追記してコンテンツを増加していきます!乞うご期待!

追記[2020/03/14]:コンテンツ追加しました。

  • ランダムフォレスト&LightGBM内部計算の可視化方法
  • 内部可視化を基にした原理解説
  • 学習の進行による予測分布の変化
  • マテリアルズインフォマティクスへの活用方法

Python初心者であれば更に理解が深まり、玄人でも更なる原理や挙動の知見を得ることができるようになりました!

是非一読あれ~

↓リンク

機械学習はこれ一本!pythonインストール~機械学習実装まで完全理解講座

 

 

そして世界に革命を起こすこと間違いなしの機械学習全自動化ライブラリ「PyCaret」の使用方法や、今後の社会を予想した

機械学習全自動化!?世界に革命を起こす「PyCaret」完全理解講座

も同時発売中です。

「PyCaret」を使いこなせば、22種類もの機械学習手法と一気に比較したり、ブラックボックスであるモデル内部の解析までわずか10数行のコードで行うことができます!

中身はこんな感じ↓

  • Pythonのインストール
  • Anaconda「JupyterNotebook」の起動
  • 仮想環境構築
  • データセット
    • 中身の確認
  • PyCaretを実装する
    • ライブラリのインポート
    • データ型を推測させる
    • モデルの構築
    • モデルの選択
    • ハイパーパラメータチューニング
    • 学習結果の可視化
    • Hyperparameters
    • Residuals Plot
    • Prediction Error Plot
    • Cooks Distance Plot
    • Recursive Feature Elimination
    • Learnig Curve
    • Validation Curve
    • Manifold Learning
    • Feature importance
    • Stackingさせる
  • 機械学習の未来について所感
    • 機械学習は社会人必須ツールへと昇華(陳腐化)する
    • 機械学習自動化で社会はこう変わる
    • チームメンバーに求められるスキルも変化する
    • データサイエンスとして突出した人材になるには?
    • この記事を見たあなたは「先行者利益」を得る

Python初心者でもインストール~全自動ライブラリ実装・解析まで出来るようになります。

980円:11080文字の教科書になっています。

全自動でもいいからパッと機械学習を実装したい!

「PyCaret」のような最新技術を使いこなしたいな。

という方には非常にオススメです。是非一読あれ!

↓リンク

機械学習全自動化!?世界に革命を起こす「PyCaret」完全理解講座

 

 

続いて一般書籍の紹介です。

こちらは、マテリアルズインフォマティクスの情報科学寄りの書籍です!

  • 機械学習とは何か?
  • どんな手法を用いるのか?
  • 12の開発事例から見る実情

など、プログラミング・材料科学初心者向けにかなり分かりやすく解説しています!

 

こちらの書籍は、材料科学者向けの本です!

大学で材料科学を専攻している方向けですね!

  • 様々な開発事例の紹介
  • 実際にマテリアルズインフォマティクスを実装する

といった特徴があります。

「とにかく、早く実装できるようになりたい!」という人は検討してみてください!

まとめ:今後の発展が楽しみな分野

マテリアルズインフォマティクスに詳しくなったでしょうか?

最近は、AI×○○といったブームが起きていますが、材料科学では昔から使われているらしいですね。

 

  • 計算手法をどうするか
  • データをどうするか
  • データサイエンティストを雇えるか
  • 化学反応の未知部分をどうするか

など、今後の課題を上手く解決して頂きたいですね!というか私も頑張って開発しますね!

マテリアルズインフォマティクスについて質問や相談などがあればTwitterのDMまで!

コメント

  1. 日本でDX教育が遅れた理由 より:

    ダイセルの久保田邦親博士(工学)の学位論文、「冷間工具鋼の合金設計に関する研究」は、ディープラーニング以前に4階層のニューラルネットワークの計算がなされているは実に興味深い。

  2. 大同だいだいインパクト大 より:

    特殊鋼の合金設計を状態図熱力学計算Calphad法と連動させたやつですね。材料物理数学再武装っていうのが人工知能のブラックボックス騒ぎを鎮静化させたことでも有名ですね。