金沙js6038

材料基因组工程研究院刘轶教授课题组发表材料机器学习的特征工程方法评述-金沙js6038

材料基因组工程研究院刘轶教授课题组发表材料机器学习的特征工程方法评述

发布时间:2025-08-28投稿:荆瑞 部门:材料基因组工程研究院 浏览次数:

近日,金沙js6038材料基因组工程研究院刘轶教授课题组在“Wiley Interdisciplinary Reviews: Computational Molecular Science”期刊(影响因子IF= 27)上受邀发表了综述论文“Integrating Materials Representations Into Feature Engineering in Machine Learning for Crystalline Materials: From Local to Global Chemistry-Structure Information Coupling”(《集成材料表征的晶体材料机器学习的特征工程:从局部到全局的化学-结构信息耦合》),引用信息为:Wiley Interdisciplinary Reviews: Computational Molecular Science, 2025; 15:e70044;https://doi.org/10.1002/wcms.70044(2025年8月11日首次上线)。博士生肖斌和唐宇超为共同第一作者,刘轶教授为通讯作者。

材料机器学习中特征工程的本质是对材料构建有效的数字化表征,对材料性质的机器学习预测精度起决定作用。目前文献报道的材料特征模型众多,但其具体形式和特点差异很大,尚缺乏从统一的视角进行横向评估。该综述对晶体材料的机器学习特征模型进行了系统的分类,重点强调了化学和结构信息的耦合。为了全面系统的评估各种特征模型的特点,综述首次采用了多维度的评价视角,包括图和非图网络结构表示、结构信息嵌入、化学-结构信息耦合、全局和局部结构特征、长程和短程作用描述、核函数和深度神经元网络的算法匹配、数据量要求、计算复杂性和可解释性等。在对典型的主流特征模型的多维度评价基础上,着重介绍了刘轶教授课题组近年来开发的“中心-环境”(Center Environment,简写CE)特征模型的构建方式、特点和应用案例。CE模型利用了预定义的注意力机制,将注意力从复杂机器学习算法内部的隐式细节转移到外部显示的描述物理核壳构型的特征模型。CE特征模型因此可以大幅度减少对数据量的需求,同时可以获得较高的精度和传递性,为开发面向材料小数据场景的高效准确的机器学习模型提供了通用的特征工程方法。该综述提出的多维度评价视角为机器学习特征模型应用时的合理选择和新特征模型的开发完善方向提供了理性依据。