科学研究

人工智能学院青年科研三组例会会议纪要

发布者:xxgc发布时间:2026-05-08浏览次数:10

会议时间:2026.5.7

会议地点:15栋315

参会人员:林豪发、胡定兴、许小迪、李琳、雷戈、王利元、罗标、袁阿兰、杨青松、李昀侪、李忆晴、杨智涵、吴楚鑫

会议主题:基于拉曼光谱的粮油一维特征筛选与定量建模研究进展

主讲人:杨智涵

一、会议内容

杨老师围绕拉曼一维拉曼光谱在食用油无损检测、特征筛选、化学计量学建模方向做阶段性科研进展汇报,结合光谱预处理、特征优选、回归建模、特征归因全套研究方法,梳理研究背景、技术难点、已完成工作及后续研究规划。

汇报首先指出拉曼光谱凭借分子指纹特性,可精准反映油脂分子结构与组分差异,但实际应用存在光谱维度高、基线漂移、荧光噪声、特征峰重叠等问题,必须依托专业数据处理与建模方法才能实现精准定量。随后指出当前行业通用技术存在的共性难题:

1.拉曼全光谱数据维度高、冗余干扰信息多,直接用于建模运算量大,还容易造成模型拟合偏差,难以精准筛选与粮油特征成分强关联的关键特征波段;

2.市面上调和油掺混形式多样,高价值油脂与普通油脂配比复杂,常规分析模型难以拟合光谱特征与组分含量之间的关联,定量误差偏大;

3.不同油脂的特征峰存在重叠干扰,如何精准区分类胡萝卜素、不饱和脂肪酸等关键物质对应的拉曼特征峰,是提升检测准确率的关键;

4.缺少统一的特征重要性评估手段,无法量化不同特征峰对定量预测结果的影响权重,模型可解释性较弱。

针对以上问题,现阶段研究完整采用光谱预处理—特征波段筛选—多模型回归预测—灰色关联归因整套技术方法开展实验:

1.光谱预处理方法:统一采用airPLS自适应迭代重加权最小二乘法做基线校正,消除荧光背景与基线漂移干扰;同时做光谱归一化处理,削弱仪器参数、采样角度带来的强度波动,保证同批次、跨批次光谱数据一致性。

2.特征筛选方法:引入CARS竞争性自适应重加权采样算法,基于蒙特卡洛采样与指数衰减筛选机制,从全波段拉曼光谱中自适应剔除冗余、无关波段,自动优选出与β-胡萝卜素、不饱和脂肪酸强相关的特征拉曼峰,解决高维光谱数据冗余问题。

3.多机器学建模方法:同步搭建偏最小二乘回归PLSR、支持向量回归SVR、人工神经网络ANN、随机森林RFR四类经典化学计量学模型,采用交叉验证方式划分训练集与测试集,以RMSE、R2作为评价指标,横向对比各模型在油脂掺混比例预测中的拟合能力与泛化性能。

4.特征贡献度分析方法:引入GRA灰色关联分析法,计算各特征拉曼峰与定量预测结果的关联度大小,量化不同特征峰对检测精度的影响权重,从机理层面解释模型预测逻辑,弥补机器学习黑箱缺陷。

目前已完成不同体积分数橄榄油与葵花籽油混合样本光谱采集,通过上述成套方法完成特征提取与模型训练,实验结果显示随机森林模型拟合效果最优,可实现混合油脂组分高精度定量,整套方法流程稳定、可复现,适合推广到食用植物油日常筛查。

二、组员讨论

汇报结束后,与会老师与同学围绕一维光谱建模优化、模型拓展、实验设计等方面展开交流。

袁阿兰老师建议,可对比MSC多元散射校正、SNV标准正态变量变换等多种预处理方法,筛选最适配粮油拉曼光谱的校正方案;同时可引入一维卷积神经网络等深度学习建模方法,与传统机器学习形成对照,进一步提升低掺量样本的定量精度。

李琳老师提出,CARS算法迭代次数、采样比例等超参数可做网格寻优,进一步提升特征筛选的精准度;同时建议增加不同温度、湿度环境下的对照实验,验证整套方法在复杂环境下的鲁棒性。

林豪发老师从科研规范角度指出,后续应补充模型消融实验,分别验证预处理、CARS特征筛选环节对最终定量结果的提升效果,固化标准化实验方法流程,为后续横向应用与学术成果沉淀打好基础。

参会同学也交流了光谱去噪、参数调优、交叉验证划分等实操方法,分享了化学计量学建模中的常见问题与解决思路。

三、会议总结

杨老师对本次汇报和讨论进行了总结。

会议肯定了当前一维拉曼光谱研究的完整方法体系,从光谱预处理、CARS特征筛选、多模型回归到灰色关联归因,技术路线规范、实验方法成熟,有效解决了高维光谱冗余、定量精度不足、模型可解释性差等问题。

同时明确后续优化方向:一是扩充油脂品类与样本梯度,验证整套方法的通用性;二是多类预处理与特征筛选算法做对比,优选最优组合方案;三是引入深度学习模型丰富建模体系,完善消融实验与参数寻优;四是固化标准化检测流程,推动方法落地到粮油现场快速定量筛查。

图为例会讨论现场