工作原理
通过材料信息学、统计、数据挖掘、机器学习等手段,分析材料结构特征,揭示特征与性能的对应关系,逐层缩小候选材料的范围,并与仿真软件形成筛选—验证—更准确筛选的正反馈回路。
图1工作流程简图
应用案例
第三代OLED (TADF)emitter分子的智能虚拟筛选。通过特征采样高亮算法,FIRST从内置214个面向有机分子的描述符(结构特征量),选出较能区分目标分子和非目标分子的特征,再用SVM,Logisitic Regression等训练出能够判别目标分子的分类器,精准捕捉数据库里的高潜力OLED emitter分子。测试集判别准确率超过95%。
图2 特征高亮
图3区分目标分子与非目标分子
图3来自 DOI: 10.1002/adma.201605444
2D铁磁材料的筛选。FIRST内置晶体维度描述符,结合其他类型的描述符能够从数十万的无机结构中一键筛选二维晶体材料。
图4快速筛选二维铁磁材料
锂电池固态电解质材料的筛选。FIRST内置20多种面向锂电池材料的描述符,通过结合AI模块提供的分类算法,能够快速检索出具有高离子电导率的候选材料。
图5筛选含锂的高离子电导率材料
图6 关键的描述符基于逻辑回归模型的训练结果
图6和算法改自DOI: 10.1039/C6EE02697D
优势特点
1,低成本,高效率地进行材料虚拟筛选;
2,材料数据库条目多达106 (有机),105 (无机),确保筛选的广度;
3,结合机器学习和材料信息学,人和算法耦合互补,确保筛选可靠性;
4,免除高昂的学习成本,易于重现经典的筛选案例;
4,背靠鸿之微材料仿真产品生态,形成筛选—验证—更准确筛选的正反馈回路。
主要模块
材料数据库
统计/特征工程模块
可视化模块
机器学习模块
结构编辑模块
第三方软件接口
主要功能
1. 材料数据库检索
2. 统计分析与可视化
3. 结合材料学原理的机器学习
4. 分子、晶体的虚拟筛选
5. 描述符计算,材料性能预测