Citizen Innovators: The Catalysts Design Arena

[to English]

情報学の技術を使って、化学の宝探しをしてみませんか?

性能の良い触媒を見つけ出すコンペを開催いたします。 既存の化学のアプローチで長い間ブレイクスルーのない触媒に対して、新しい高性能触媒を、情報学の方法・アプローチによって見つけ出した人を表彰いたします。 入賞者には旅費は支給し、発表会に招待して表彰いたします。

企画背景

エチレンは工業的に最も重要な化合物の一つであり、塩化ビニル・アクリルニトリル・酢酸ビニルなどを経由して、合成繊維・ビニール・断熱材・絶縁体・農業資材・建築材料・水道パイプ・包装材料など様々な用途で利用されています。 このエチレンをメタンからなる天然ガスから生成する化学反応として、メタン酸化カップリング (OCM: Oxidative coupling of methane) が知られています。 しかしながら、OCMにおいて多くのメタンは反応の過程で燃焼してしまい、目的の合成物ではなく、一酸化炭素や二酸化炭素になってしまします。 そのため、目的の合成物をより多く生成するため、反応に働きかける触媒の研究が長年行われています。 しかし、触媒の反応メカニズムはいまだに解明されていない部分が多く、触媒候補は熟練した化学者の思考や経験から導き出されますが、基本的には手さぐりに近い状態といえます。

一方で、近年AI技術の発達により、情報技術で高機能な新規物質や材料候補の探索を行う動きが加速しています。 運営委員の高橋(北海道大学・教授)は、機械学習を使った触媒候補の探索を行いました。 その研究で得られた知見とデータを公開し、コンペティションを開くことで、様々なアイディアや方法論をこの世界に呼び込みたいと考えました。 それにより、今までの化学者の発想とは異なるまったく新しい考え方が生み出されることを期待しています。

このような企画は、近年着目されている市民サイエンスの新しい形となりえる、新しい形のサイエンスと言えるかもしれません。 コンペの参加者の皆さんも、自身の考えや方法論を用いて新しい触媒の発見に挑戦するとともに、他の参加者の方法を見ることで自身の考えの外にある発想やアプローチとその効果を知り、情報技術を多面的に理解し活用できるようになる絶好の機会になると考えています。

参加者のタスク

本コンペの応募内容は簡単です。 新しい触媒として優等になりそうな、触媒候補とそれを導き出した手順書を投稿します。 触媒候補とは3つの元素と1つの担体の組み合わせであり、利用可能な元素と担体は下記に提示します。 触媒候補を導き出す方法は、機械学習などの情報技術・情報学的なアイディアで行って欲しく思います。 どのような情報学的手法を使っても良いですし、どのようなコンピュータを使っても良いです。 あるいは手計算でもかまいません。 過去の論文などから集めた実験のデータを下記に示しますので、それを用いて新しい触媒候補を見つけ出してください。 準備されたデータ以外のデータを使ってもかまいません。

本コンペでは、投稿された触媒候補に対して運営サイドが実際に評価実験を行い、エタンやエチレンなど炭素がつながった化合物の収率を評価します。 そして収率の高い順に参加者に順位を付け、入賞者を決定し、表彰します。 詳細な評価実験の設定については下記に提示します。 実際の触媒においては元素の配合率や実験環境を調整することが可能ですが、本コンペにおいては実験の効率性や安全性の観点から配合率は1:1:1に、実験環境も下記に示す環境で固定する点にご注意ください。

現在もっとも収率が良いとされている触媒は、3元素 Na,Mn,W と担体 SiO2 の組み合わせで、運営委員の実験環境では収率21%を達成しました(ただし、配合比率は2:2:1としています)。 本コンペの目標は、同じ反応評価条件下でこの収率 21% を超える触媒候補を見つけることが目標ではありますが、これを超えなくとも投稿された触媒候補の中で収率が高い上位数件を表彰いたします。 ただし準備されたデータや発表済みの論文に含まれる組合せは無効とします。

一般の機械学習コンペとの違い

一般の機械学習コンペでは、データを元に目的の数値を正確に予測することがタスクとなります。 しかし、本タスクにおけるデータは以下のような理由により、非常に大きなノイズを含むため、このデータの収率を正しく予想することに本当に意味があるかはわかりません。

  • 同じ触媒組成でも、実験環境が異なると収率が変化する場合がある(同じ触媒組成でも論文によって報告される収率が異なる)
  • 同じ実験環境でも、実験のたびに収率が異なる場合がある(必ずしも実験において平均的な値が得られるとは限らない)
  • ヒューマンエラーにより、データにノイズや誤りが含まれる(収率 100 % のような極端なデータも含まれている)
本コンペでは収率を正しく予想することは目的ではなく、如何なる方法であれ、有望な触媒候補を見つけられたかのみを評価します。 そのためにデータから異常値を取り除いたり、特定の値を無視したり、そもそも提供されたデータを使わなくても問題ありません。

データから新しい化学物質を見つけ出そうとするのは、そもそもこのようなものなのです。 データ取得条件がそろっておらず、論文によってどこまで記述するかも様々であるので、正確な予測をするのにはあまりあてにならないのです。 しかも今回は、あらかじめ実験した触媒の精度を当てる、というものではなく、我々も実験したことがない未知の触媒を実験するのです。 精度の高い予測、というよりも探索をするというほうが近いでしょう。 このようなタスクなので宝探しと呼びたいのです。

参加方法

本コンペへの参加は、こちらのフォームから①手法解説書、②触媒候補リスト、③同意書を投稿することで行ってください。 手法解説書は、(1)投稿者の名前と所属、(2)触媒候補を第1希望から最大第15希望まで、(3)触媒候補を導くために用いた手法・ツール・アイディア等をこの順番で記述した PDF とします。 手法解説書を読めば第三者が同じ結果を再現できるよう記述ください。 我々が用意したデータ以外を利用した場合は、そのデータの参照方法も含めてください。 言語は原則英語としますが、日本語も許可します。 触媒候補リストは、各行が触媒候補(3つの元素と1つの担体の組み合わせ)であり、1行目が第1希望であるようなるCSVファイルとします。 同意書は、こちらのフォームに投稿者のサインをしたものをPDF化したものとします。 詳細は下記で述べますが、知財放棄と、運営委員会が執筆するコンペティション開催報告論文に投稿した手法解説書と候補触媒の掲載に同意いただきます。 同意書にサイン頂けない投稿はリジェクトとし、投稿されなかったものとして扱います。 もし提出された触媒候補リストに無効な組み合わせが含まれる場合、それを除外して評価を行います。

評価方法

触媒候補の評価実験は、運営委員の西村(北陸先端科学技術大学院大学・准教授)の研究室で実施します。 基本的には投稿されれたすべての第一希望の触媒候補について一回の評価実験を行い収率を測定します。 ただし投稿数が予想より多い場合、運営委員で各投稿を事前審査し、条件を満たさない論文等を除外した後に抽選で評価実験を行う投稿を選定します。 また投稿数が少ない場合、各投稿の第2希望、第3希望と順に予算と期間が許す範囲で追加で評価します。 上記の評価において上位の触媒候補に対しては追加実験を行い、より正確な収率を測定し、この値を元に最終的な順位を決定します。 元素の組合せによっては、安定的に実験ができない場合も十分考えられます。 この場合は実験者の責任とせず、不適切な触媒候補であると評価させて頂きます。 より詳細な審査方法についてはこちらを参照ください。

詳細な評価実験環境は以下の通りです。

  • 触媒調製は水溶液を用いた共含侵法により実施します。 3種類までの元素を溶解した水溶液に担体を混合後、水を除去することで金属を簡便に担持できる方法です。
  • 金属の担持量は、担体 1.0g 使用時に3元素での合計が0.6 mmolとなるように担持します。 乾燥して得た粉末を900℃で焼いて実験に使用します。 OCM反応の評価には、常圧固定相流通式反応装置を用います。
  • 50mg の触媒を内径 4mm の石英管に粉末状態で封入し、500℃で酸素処理後、OCM雰囲気(CH4/O2/N2 = 21/7/3 cc, CH4/O2 = 3.0)で500℃から850℃へ昇温し、C2収率を50℃おきに評価します。 標準触媒であるNa-Mn-W/SiO2は、800℃でC2収率 = 21.7 ± 0.38 %を示します。
  • 後述するデータの表記で表すと、実験環境は [Temperature, Pch4, Po2, Par] = [T, 0.677, 0.226, 0.097] (T = 500, 550, ..., 850) の8設定となります。

結果発表

2025年3月に上位3件の投稿を表彰する発表会を開催予定です。 発表会の場所および開催形式(いずれかの学会で行うか等)は未定です。 入賞者には旅費を支給いたしますので、触媒候補の導出に用いた方法やアイディアなどに関して発表をお願いいたします。 入賞者には開催の一ヶ月以上前に連絡いたしますので、そこから旅費手続き等を開始します。 賞金は予算の都合上なしとさせて頂きます。

データ

こちらのページに今まで世界で発表された論文において報告された触媒のデータがまとめられてあります。 このデータにおける、各実験の環境やパラメータの説明は以下の通りです。

                *Small amount of catalysts (M1 M2 M3) are disperse over the support materials.
                M1 M2 M3: catalysts element.
                Support: Support material for catalysts.
                Temperature: Reaction temperature in celsius.
                Pch4: Methane gas amount
                Po2: Oxygen gas amount
                Par: Inert gas amount
                C2y: Yield of produced ethane and ethylene.

                Note
                *Total of Pch4, Po2, Par is 1.
                *M1 M2 M3 support are catalysts information.
                *Temperature,Pch4,Po2, Par Are experimental condition.
                *C2y is objective variable.
                *Material information can be replaced by physical quantities using code like xenonpy.
                *Lastly, data preprocessing is performed for literature data where data contained M4,
                anions, promoters are removed. Catalsyst compositions without support is removed.
                Catalysts having more than 50mol% is considered as support. Unknown support is excluded.

                参考文献です:HTP:ACS Catal. 2021, 11, 1797-1809
                Literature:ChemCatChem 3.12 (2011): 1935-1947
              

利用可能な元素と担体

元素としては原則、以下が利用可能です。

Li,
Na, Mg, Al
K, Ca, Sc, V, Mn, Fe, Co, Ni, Cu, Zn, Ga
Rb, Sr, Y, Zr, Nb, Mo, Ru, Rh, Pd, Ag, In, Au, Pt
Cs, Ba, Hf, Ta, W, Re, Ir, Tl, Pb
La, Ce, Pr, Nd, Eu, Gd, Tb, Dy, Ho, Er, Tm, Yb, Lu

担体としては原則、以下が利用可能です。

MgO, γ-Al2O3, α-Al2O3, SiO2, CaO, rutile-TiO2, MnO2, Fe2O3, CoO2, ZnO, SrO, Y2O3, ZrO2, Nb2O5, La2O3, CeO2, Nd2O3, BaCO3

上記のリストに含まれる元素・担体であっても、場合によっては主催者が入手できない場合があります。 その場合はそれを含む触媒候補は無効とさせて頂きます。 また上記のリストに含まれない元素・担体を含む触媒候補を提出頂いても構いません。 そのような候補は、主催者がその元素・担体を利用可能と判断した場合は有効、そうでなければ無効とさせていただきます。 基本的にはレアメタルなど高価な材料や取り扱いが難しい・危険な材料は利用できません。

開催日程

2024年7月中 CFP公開、データ類公開、投稿サイト開設
2024年10月1日 投稿受付開始
2024年11月20日 23:59 (AoE) 投稿〆切
2025年2月上旬 成績優秀者に連絡
2025年3月中旬 結果発表、表彰式、成績優秀者の発表
上記は現段階での予定です。 正確な日程は都度更新いたします。

運営委員と主催

当企画は、有志による運営委員会により企画・運営されています。 また、JST CREST(代表 高橋啓介)と科学研究費補助金 学術変革A(代表 湊真一)の共同の共催となります。 運営委員会は以下のメンバーによって構成されています。

  • 高橋 啓介:北海道大学・教授
  • 西村 俊:北陸先端科学技術大学院大学・准教授
  • 瀧川 一学:京都大学・特定教授
  • 安田 宜仁:NTTコミュニケーション科学基礎研究所・主幹研究員
  • 石畠 正和:NTTコミュニケーション科学基礎研究所・主任研究員
  • 宇野 毅明:国立情報学研究所・教授

本コンペについて不明な点等がありましたら までお問い合わせください。 また、寄せられた質問と回答はFAQとして本ページに掲載予定ですので、参考にしてください。

知財について

投稿頂いた触媒候補については、運営委員会・運営員個人・関係者の如何なる者も知財は取得いたしません。 参加者の方にも、知財放棄することを条件にコンペに参加していただきます。 これは知財関係でトラブルが発生することを防ぐためです(権利関係をクリアにするために、権利放棄に同意する旨の書類にサインしていただきます)。 知財を取得したい場合は、当コンペには参加せず、ご自分か共同研究と実験なさって、知財取得を行ってください。 開発した技術などについて個別に論文を書きたい場合(特に機械学習の手法として)は、別途書いていいことといたします。 この場合、コンペでの実験結果を参照して良いこととします。

コンペティション開催論文について

今回のコンペティションについては、その開催の目的や開催の詳細と投稿された手法、候補触媒やその性能を集めた論文として、化学系の論文誌に学術論文として投稿予定です。 投稿された触媒候補と手法解説書はすべて論文に含めます。 論文には、すべての投稿者を著者として含む予定ですが、投稿数が多い場合には、上位入賞者、その他興味深い手法を提案された投稿者について、運営委員のほうから共著者としての参加を打診いたします。

参加基準について

運営委員のコンペ参加は禁止しますが、その関係者(研究室の学生等)の参加は可能とします。 小規模な企画ですので、投稿数が少なくなることを避けるための措置としてご理解ください。 運営委員の関係者という理由で優遇されることはありません。 投稿数が多すぎる場合には各投稿を事前審査しますが、その場合は運営委員は関係者の審査からは外れることとします。

不慮の事態などの対応について

  • 機械の破損や故障など、なんらかの理由で評価実験が実施不能になることが考えられます。 このような場合、やむを得ない事情として本コンペ自体を中止させて頂きます。 後日、再度実験環境を整得れた場合、あるいは他に実験可能な方の協力を得られた場合は、本コンペを再開させて頂きます。
  • 基本的に実験には誤差が乗ります。 通常は実験を複数回行って正確な値を評価しますが、本コンペでは実験リソースに限りがあるため、各触媒候補に対して1回の実験とさせて頂きます。 その結果、多少の誤差が予想されますが、そこまで含めての競争とさせてください。
  • 多くの投稿があり、すべての投稿を評価できない場合、後日2回目のコンペを開催したいと考えています。 その際には、参加者と相談の上、実験しきれなかった投稿もコンペにエントリーできる仕組みを考えたいと思います。
  • 投稿された触媒候補に関しては、実験されているもの、されていないものに関わらず、他の研究者が自身の研究のアイディアに利用して良いとします。 ただしその際は必ず文献として参照すること、というルールをつけさせていただきます。

宝探しの方法について

宝探しの方法はいろいろ考えられると思います。 いわゆる機械学習のテクニックを使い、精度の高い予測で行くなら、例えば上述の提供データの中で、北陸先端科学技術大学院大学 谷池教授が同一の装置と環境で行ったデータ(typeがHTPになってるもの)に限定すれば、精度が高くなるかもしれません。 文献データ(type が Literature になってるもの)も入れれば、データ数も、学習する範囲も広がるので、一つ一つのデータは誤差などを含んでも、こちらのほうが精度が上がるかもしれません。 データは前処理をしてあるのですが、前処理をより工夫することで、精度があがるかもしれません。全然違うアプローチで、ヒートマップのような可視化を行いつつ、人間が目で探してもいいかもしれません。 データを離散化して、パターンマイニングやクラスタリングを用いれば、多少の誤差や異常値も気にならないかもしれません。 組み合わせる元素の情報を増やす方法もあります(融点、沸点、イオン化傾向、最外殻の電子数、など)。 元素の様々な特徴を組み合わせて新しい特徴量を作ることもできると思います。 通常の機械学習のタスクにはないような要因が様々ある、これが今回のコンペのチャレンジングなところだと思います。 データから新規触媒を発見する論文がいくつかありますので、前処理の方法や特徴量の選び方を参考にすると良いかと思います。