1-23、MatCloud: 快捷开展高通量多尺度材料计算及数据库建设的云平台和软件包

1-23MatCloud: 快捷开展高通量多尺度材料计算及数据库建设的云平台和软件包

杨小渝

中科院计算机网络信息中心材料基因实验室

摘要:采用人工智能技术辅助新材料设计的一个主要瓶颈在于材料数据的缺失和稀少。而材料计算模拟在很多情况下,可以弥补实验数据的不足、降低实验成本并加快研发速度。 而开展材料计算模拟的较高门槛,却阻碍了材料计算模拟的使用。比如,用户不仅要熟悉材料计算软件(如VASP),还要对Linux系统非常熟悉,解决计算资源的问题,而且计算数据也得不到集中且有效地管理,极易地丢失。跨尺度计算更是增加了计算的难度。

为此,我们研发了帮助快捷开展高通量材料计算和建立材料计算数据库的云平台和技术(用户需自带商业软件版权如VASP)。与业界的高通量材料计算软件如AFLOW,Materials Project,AiiDA,Materials Studio等相比,MatCloud的主要创新点在于支持云计算的模式开展高通量材料计算,并且云端支持以图形化的“拖拽”方式进行高通量多尺度作业设计,并且帮助通过计算快速地构建材料计算数据库。此外,MatCloud正融合人工智能技术,使得可以在线基于构建的材料计算数据库开展相关数据挖掘工作。

MatCloud是我国自主知识产权的高通量材料集成计算和数据管理技术(Computational Material Science, 146 (2018) 319–333 )。其主要特点为 “高通量、高并发、网络化、图形化、集成化、流程化、自动化、多尺度”。用户仅需要一个浏览器,就可容易地开展材料计算模拟,作业提交和多尺度计算的数据管理,极大地降低了用户开展计算模拟的门槛值,使得通过大规模计算模拟,进行材料成分设计、性质预测、及机理解释等成为可能,并通过材料数据库实现了不同尺度计算数据的集中管理和挖掘,并可以帮助用户或企业快速构建材料计算数据库。目前MatCloud还初步支持分子动力学软件LAMMPS,以及开源的第一性原理计算ABINIT,支持高通量跨尺度的材料计算模拟。

MatCloud 不仅支持云平台模式,也支持软件包使用模式。采用云平台的模式,用户无需下载任何软件和插件,只需网页浏览器,通过帐号、密码登陆 http://matcloud.cnic.cn,即可在线开展高通量跨尺度材料计算并快速构建材料计算数据库。MatCloud于2017年 4月上线运行(MatCloud 的研发经历了3 个版本),用户培训5期,注册用户截至目前已接近900(包括来自美国,欧洲,香港、新加坡等的用户)。注册单位近400家,专利申请受理3件,申报中1件,专利转化1件,软件著作权4件,支持10000次级高通量计算的能力。

采用软件包的模式,MatCloud 可以装在一台高配置的服务器上并部署在用户现场,从而使得用户可以采用自己的超算资源开展高通量多尺度材料计算并形成完全私有的材料计算数据库。

目前,MatCloud在国家重点研发计划,国家自然科学基金,四川省院/省校重点项目、及中科院先导项目的资助下,正用于相变/阻变存储材料,纳米光催化材料,钙钛矿太阳能电池材料,氢能材料、及防辐照损伤材料等的研发。MatCloud技术也已经用于国家材料基因工程数据库的研发。

MatCloud 的研发得到了不少单位的支持和帮助。 未来,MatCloud 将在国家重点研发计划项目的支持下,与北航(孙志梅团队),北科大(宿彦京及张晓彤团队)等团队紧密合作,进一步研发高通量材料集成计算技术,并将其用于国家材料基因工程数据库的建设。 本报告将介绍MatCloud的研发理念,方法,技术,应用,以及对未来的展望。

DOI:10.12110/secondfmge.20181014.123

Brief Introduction of Speaker
杨小渝

博士、英国剑桥大学博士后,现为中科院“百人计划”研究员,中科院计算机网络信息中心材料基因信息技术实验室主任。

杨小渝研究员的研究成果和创新体现了多学科,跨领域的特点。目前主要从事材料基因组高通量材料集成计算、材料多尺度模拟计算等关键核心技术,以及材料第一性原理计算数据库的建设。曾参与了十多个英国政府及欧盟框架项目的研发,对信息化技术的应用,以及如何沿用国际化的方法和模式系统地开展交叉学科项目的研究有着深刻的理解。在国际重要期刊、国际学术会议发表学术论文20余篇,并著有三部英文学术著作;同时还担任国际期刊主编/国际学术会议审稿人。2011年获由教育部,科技部举办的第五届“春晖杯”留学人员创新创业大赛二等奖。2010年经香港特别行政区“香港优秀人才入境计划”遴选,获“香港优秀人才入境”身份(放弃赴港,直接归国)