S3-09 高通量计算和深度学习在多孔材料吸附甲烷研究中的应用

高通量计算和深度学习在多孔材料吸附甲烷研究中的应用

王睿涵1,杨明理2,徐定国1,2*

1四川大学化学学院,绿色化学与技术教育部重点实验室,四川成都,610064

2四川大学材料基因组工程研究中心,四川成都,610065


详细摘要: 天然气的主要成分是甲烷,被认为是具有前途的移动应用替代燃料。目前天然气发展的一个障碍是甲烷的储存问题,而压缩天然气或液化天然气的主要缺点是需要昂贵的重型高压储存容器,或者保持低温。吸附天然气是一种很有吸引力的替代品,可以在室温和中等压力下以足够高的密度将天然气储存在吸附剂的孔隙中。因而高效吸附材料的开发则是吸附天然气技术成功的关键。金属有机骨架材料(MOFs) 具有非常大的比表面积,高孔隙率,合理的热稳定性和机械稳定性,在气体吸附领域应用广泛。然而,从实验上运用试错法很难找到最佳吸附材料。随着机器学习算法的发展,近年来结合高通量计算和机器学习模型的研究模式已在材料设计和研发中发挥出重要的作用。本次报告以 MOFs 吸附甲烷 1 为研究目标。我们首先通过高通量巨正则蒙特卡洛 (GCMC) 模拟得到了分布均匀的数据集。采用了晶体图卷积神经网络 (CGCNN)2,以甲烷吸附工作容量为目标函数,构建了二分类模型。在 CGCNN 算法中原子由顶点描述,化学键由边描述,晶体结构被看作一个个独立的 “ 图 ”。这种基于图算法的普适性模型可以准确筛选出对甲烷吸附具有高表现的 MOFs 体系,能够在极短时间对超过32 万个MOFs 的虚拟库做出识别筛选,同时我们获得了 MOFs 和甲烷工作容量的结构 - 功能关系。但是在研究过程中,我们发现仅采用 CGCNN 模型尚不能获得一个预测准确的回归模型,尤其是预测值与实验值存在较大误差。因此我们优化了具有开放位点 MOFs 的力场参数,重新对数据集进行了高通量计算,期望甲烷吸附值更接近与实验水平。同时考虑了无机多核簇和它们的最近邻原子信息,将 CGCNN 算法融入了MOFs 的孔腔极限直径,最大孔腔直径,孔隙率和可及体积相应的结构领域知识,我们将改进的深度学习框架称为MOF-CGCNN。 MOF-CGCNN 结合了开放金属位点的信息和 MOF 的几何结构特性,能够很好地描述不同类型 MOFs 的特征。因此我们得到了一个可以准确预测甲烷吸附量的回归模型 ( 皮尔逊相关系数0.973,平均绝对误差 9.98cm3/cm3)。为了增强深度学习模型的能力,我们采用迁移技术将从65 bar 甲烷吸附研究中获得的机器知识应用于不同的性质,例如不同压力的甲烷吸附量以及基于超小数据集的甲烷吸附能预测。研究表明迁移学习技术仅使用500 个训练集样本,就可以达到直接学习利用3500 个训练集的样本。MOF-CGCNN 模型以及基于优化力场获得的气体吸附数据集可以对 MOFs 的甲烷吸附做出近乎定量的预测,对于大多数有实验值的MOFs, MOF-CGCNN 的预测值与实验测量结果之间的误差在 15% 以内。迁移性学习的表现也表明其可以在小数据集情况下,用于更多性质预测或者更广泛的研究方向。


参考文献:
[1] Wang, R.; Zhong, Y.; Bi, L.; Yang, M.; Xu, D., ACS Appl. Mater. Interfaces, 12, (2020) 52797-52807
[2] Xie, T.; Grossman, J. C., Phys. Rev. Lett., 120, (2018) 145301

Brief Introduction of Speaker
徐定国

徐定国教授,毕业于四川大学,博士后工作于新墨西哥大学化学与化学生物系,现为四川大学化学学院教授,博士生导师。长期从事复杂体系的多尺度高通量计算模拟方面的研究,开发了生物医用材料高通量计算平台软件。 2010 年入选教育部新世纪优秀人才支持计划,先后主持国家自然科学基金5 项, 主持 2016 年国家重点研发计划课题《骨 / 软骨诱导性材料的高通量计算模型、方法和软件开发》。在 JACS、 Angew、 JPCA/B/C 等学术期刊上发表论文 100 多篇。