4-17、分布式材料数据库关联搜索算法及应用
Association search algorithm for distributed material database and its application
苏航1,2*,杨丽1,段琳娜2,王畅畅2
1.钢铁研究总院,2.北京钢研新材科技有限公司
摘要:数据库和大数据技术是“材料基因工程”(MGE)三大支撑平台和关键技术之一。网络化、标准化、商业化和智能化是材料数据库走向共享化发展的重要方向。但材料数据的共享长期存在三大技术和管理难题:材料性能千差万别带来的结构化难题、数据产权带来的汇交难题、数据库更新维护难题。钢铁研究总院开发的全球钢铁材料数据信息系统包含有超过50个公共及企业标准体系、10万+材料牌号,1000万+材料数据,并在此基础上开发了包含公有云、私有云的分布式数据管理体系。针对长期困扰材料数据库研发应用的结构化难题,提出了材料关联的概念,并设计了关联数据结构及相似度函数算法,成功实现了不同来源材料数据的关联匹配,并在全球钢铁材料牌号匹配、多实验室材料数据关联协同、焊材材料智能选配等方面获得成功应用。在此基础上有望建立广泛的材料大数据众筹及分布式检索系统。
关键词:分布式数据库,关联搜索,算法,钢铁材料,焊接材料
通讯作者:苏航,Email: hangsu@vip.sina.com
DOI:10.12110/secondfmge.20181014.417
钢铁研究总院教授,博士生导师,北京钢研新材道科技有限公司总经理。1997年中国科学院上海冶金研究所获博士学位。主要研究领域为特种低合金钢、材料计算及信息系统。
主持和参加了30余项国家973、863、支撑计划、国防军工配套项目研究。参与材料基因组重点研发专项2项。在材料热动力学技术应用方面、舰船用钢方面出版专著2部;主持建立了国内首个全球钢材牌号服务平台及信息服务系统。