会议时间:2026.5.7
会议地点:15栋315
参会人员:林豪发、胡定兴、许小迪、李琳、雷戈、王利元、罗标、袁阿兰、杨青松、李昀侪、李忆晴、杨智涵、吴楚鑫
会议主题:基于拉曼光谱的粮油一维特征筛选与定量建模研究进展
主讲人:杨智涵
一、会议内容
杨老师围绕拉曼一维拉曼光谱在食用油无损检测、特征筛选、化学计量学建模方向做阶段性科研进展汇报,结合光谱预处理、特征优选、回归建模、特征归因全套研究方法,梳理研究背景、技术难点、已完成工作及后续研究规划。
汇报首先指出拉曼光谱凭借分子指纹特性,可精准反映油脂分子结构与组分差异,但实际应用存在光谱维度高、基线漂移、荧光噪声、特征峰重叠等问题,必须依托专业数据处理与建模方法才能实现精准定量。随后指出当前行业通用技术存在的共性难题:
1.拉曼全光谱数据维度高、冗余干扰信息多,直接用于建模运算量大,还容易造成模型拟合偏差,难以精准筛选与粮油特征成分强关联的关键特征波段;
2.市面上调和油掺混形式多样,高价值油脂与普通油脂配比复杂,常规分析模型难以拟合光谱特征与组分含量之间的关联,定量误差偏大;
3.不同油脂的特征峰存在重叠干扰,如何精准区分类胡萝卜素、不饱和脂肪酸等关键物质对应的拉曼特征峰,是提升检测准确率的关键;
4.缺少统一的特征重要性评估手段,无法量化不同特征峰对定量预测结果的影响权重,模型可解释性较弱。
针对以上问题,现阶段研究完整采用光谱预处理—特征波段筛选—多模型回归预测—灰色关联归因整套技术方法开展实验:
1.光谱预处理方法:统一采用airPLS自适应迭代重加权最小二乘法做基线校正,消除荧光背景与基线漂移干扰;同时做光谱归一化处理,削弱仪器参数、采样角度带来的强度波动,保证同批次、跨批次光谱数据一致性。
2.特征筛选方法:引入CARS竞争性自适应重加权采样算法,基于蒙特卡洛采样与指数衰减筛选机制,从全波段拉曼光谱中自适应剔除冗余、无关波段,自动优选出与β-胡萝卜素、不饱和脂肪酸强相关的特征拉曼峰,解决高维光谱数据冗余问题。
3.多机器学建模方法:同步搭建偏最小二乘回归PLSR、支持向量回归SVR、人工神经网络ANN、随机森林RFR四类经典化学计量学模型,采用交叉验证方式划分训练集与测试集,以RMSE、R2作为评价指标,横向对比各模型在油脂掺混比例预测中的拟合能力与泛化性能。
4.特征贡献度分析方法:引入GRA灰色关联分析法,计算各特征拉曼峰与定量预测结果的关联度大小,量化不同特征峰对检测精度的影响权重,从机理层面解释模型预测逻辑,弥补机器学习黑箱缺陷。
目前已完成不同体积分数橄榄油与葵花籽油混合样本光谱采集,通过上述成套方法完成特征提取与模型训练,实验结果显示随机森林模型拟合效果最优,可实现混合油脂组分高精度定量,整套方法流程稳定、可复现,适合推广到食用植物油日常筛查。
二、组员讨论
汇报结束后,与会老师与同学围绕一维光谱建模优化、模型拓展、实验设计等方面展开交流。
袁阿兰老师建议,可对比MSC多元散射校正、SNV标准正态变量变换等多种预处理方法,筛选最适配粮油拉曼光谱的校正方案;同时可引入一维卷积神经网络等深度学习建模方法,与传统机器学习形成对照,进一步提升低掺量样本的定量精度。
李琳老师提出,CARS算法迭代次数、采样比例等超参数可做网格寻优,进一步提升特征筛选的精准度;同时建议增加不同温度、湿度环境下的对照实验,验证整套方法在复杂环境下的鲁棒性。
林豪发老师从科研规范角度指出,后续应补充模型消融实验,分别验证预处理、CARS特征筛选环节对最终定量结果的提升效果,固化标准化实验方法流程,为后续横向应用与学术成果沉淀打好基础。
参会同学也交流了光谱去噪、参数调优、交叉验证划分等实操方法,分享了化学计量学建模中的常见问题与解决思路。
三、会议总结
杨老师对本次汇报和讨论进行了总结。
会议肯定了当前一维拉曼光谱研究的完整方法体系,从光谱预处理、CARS特征筛选、多模型回归到灰色关联归因,技术路线规范、实验方法成熟,有效解决了高维光谱冗余、定量精度不足、模型可解释性差等问题。
同时明确后续优化方向:一是扩充油脂品类与样本梯度,验证整套方法的通用性;二是多类预处理与特征筛选算法做对比,优选最优组合方案;三是引入深度学习模型丰富建模体系,完善消融实验与参数寻优;四是固化标准化检测流程,推动方法落地到粮油现场快速定量筛查。

图为例会讨论现场

