4-2、抗肿瘤/组织再生性材料数据库的构建与调试
王黎成1, 史颖欢1, 高阳1*, 杨晓2, 朱向东2, 马立敏3, 张余3, 董昊1,马晶1*
1.南京大学,2.四川大学,3.广东省人民医院
摘要:在国家重点研发计划的资助下,我们合作开发了抗肿瘤/组织再生性材料数据库,用于高通量计算数据、高通量实验数据以及临床治疗数据的存储与分析,期望与人工智能、机器学习技术融合,驱动抗肿瘤/组织再生性新材料的创新设计。本文详细介绍了数据库的基本架构与关键技术。整个数据库系统采用B/S(浏览器服务器体系)架构,用户通过前端页面登录到数据库,对个人信息进行管理,以及对数据库进行系列化操作。针对重点研发项目中各个课题的设置,数据库分为理论计算数据、材料制备与性能实验数据、肿瘤临床治疗数据三大部分。理论计算数据涵盖了各个不同尺度的理论计算结果,包括材料微观电子结构的高精度计算和第一性原理计算、介观尺度下材料中原子或分子聚集体的分子力场或是量子力学/分子力学结合的计算、用于治疗器件等宏观性质的有限元模拟结果。实验结果数据库则包括了材料的组成与形貌、制备方法、各种结果表征与图谱、力学、光学、电学、热学等物理性质、生物学评价等。肿瘤临床治疗数据包括疾病基本信息、影像学数据、病理检测报告等。现阶段,数据库完成了基本框架构建,实现了高通量计算数据的批量上传导入、数据自动分析。实验数据和临床数据部分正在尝试导入数据库中。期望在未来,基于收集的海量数据,采用机器学习技术找出特征性参量,预测出具有特定性能的候选材料,并结合实验进行新材料的研发。
关键词:数据库;机器学习;人工智能;材料信息学;理论与计算模拟
DOI:10.12110/secondfmge.20181014.402
马晶,1992和1995年分别获南京理工大学本科和硕士学位,1998年在南京大学化学化工学院获得博士学位。1998-2000年作为日本学术振兴会(JSPS)特别研究员在日本歧阜大学进行博士后研究。2000-2005年任南京大学副教授,2005年7月起,任南京大学化学化工学院教授。作为项目(课题)负责人,承担了国家重大科学研究计划项目课题、重点研发项目课题、国家自然科学基金委杰出青年科学基金、教育部新世纪人才培养计划、霍英东青年教师基金等项目。获第九届“中国青年女科学家”奖,南京市科技创新奖、江苏省新长征突击手、江苏省“巾帼建设”标兵,江苏省高校优秀党员等荣誉。担任《物理化学学报》编委。
她的研究兴趣为功能材料的理论模拟与设计,致力于发展快速有效的模拟方法,探索功能材料分子在服役条件下的微观机制。最近,在国家重点研发计划重点专项课题的资助下,她与南京大学计算机系、四川大学、广州市人民医院的专家一起开发了肿瘤抑制与组织再生材料数据库,探索将机器学习和数据分析手段与理论计算和实验结果相结合,研究材料的结构与性能关系。