人工智能学院青年科研三组例会会议纪要

发布者：xxgc发布时间：2026-05-08浏览次数：10

会议时间：2026.5.7

会议地点：15栋315

参会人员：林豪发、胡定兴、许小迪、李琳、雷戈、王利元、罗标、袁阿兰、杨青松、李昀侪、李忆晴、杨智涵、吴楚鑫

会议主题：基于拉曼光谱的粮油一维特征筛选与定量建模研究进展

主讲人：杨智涵

一、会议内容

杨老师围绕拉曼一维拉曼光谱在食用油无损检测、特征筛选、化学计量学建模方向做阶段性科研进展汇报，结合光谱预处理、特征优选、回归建模、特征归因全套研究方法，梳理研究背景、技术难点、已完成工作及后续研究规划。

汇报首先指出拉曼光谱凭借分子指纹特性，可精准反映油脂分子结构与组分差异，但实际应用存在光谱维度高、基线漂移、荧光噪声、特征峰重叠等问题，必须依托专业数据处理与建模方法才能实现精准定量。随后指出当前行业通用技术存在的共性难题：

1.拉曼全光谱数据维度高、冗余干扰信息多，直接用于建模运算量大，还容易造成模型拟合偏差，难以精准筛选与粮油特征成分强关联的关键特征波段；

2.市面上调和油掺混形式多样，高价值油脂与普通油脂配比复杂，常规分析模型难以拟合光谱特征与组分含量之间的关联，定量误差偏大；

3.不同油脂的特征峰存在重叠干扰，如何精准区分类胡萝卜素、不饱和脂肪酸等关键物质对应的拉曼特征峰，是提升检测准确率的关键；

4．缺少统一的特征重要性评估手段，无法量化不同特征峰对定量预测结果的影响权重，模型可解释性较弱。

针对以上问题，现阶段研究完整采用光谱预处理—特征波段筛选—多模型回归预测—灰色关联归因整套技术方法开展实验：

1.光谱预处理方法：统一采用airPLS自适应迭代重加权最小二乘法做基线校正，消除荧光背景与基线漂移干扰；同时做光谱归一化处理，削弱仪器参数、采样角度带来的强度波动，保证同批次、跨批次光谱数据一致性。

2.特征筛选方法：引入CARS竞争性自适应重加权采样算法，基于蒙特卡洛采样与指数衰减筛选机制，从全波段拉曼光谱中自适应剔除冗余、无关波段，自动优选出与β-胡萝卜素、不饱和脂肪酸强相关的特征拉曼峰，解决高维光谱数据冗余问题。

3.多机器学建模方法：同步搭建偏最小二乘回归PLSR、支持向量回归SVR、人工神经网络ANN、随机森林RFR四类经典化学计量学模型，采用交叉验证方式划分训练集与测试集，以RMSE、R2作为评价指标，横向对比各模型在油脂掺混比例预测中的拟合能力与泛化性能。

4.特征贡献度分析方法：引入GRA灰色关联分析法，计算各特征拉曼峰与定量预测结果的关联度大小，量化不同特征峰对检测精度的影响权重，从机理层面解释模型预测逻辑，弥补机器学习黑箱缺陷。

目前已完成不同体积分数橄榄油与葵花籽油混合样本光谱采集，通过上述成套方法完成特征提取与模型训练，实验结果显示随机森林模型拟合效果最优，可实现混合油脂组分高精度定量，整套方法流程稳定、可复现，适合推广到食用植物油日常筛查。

二、组员讨论

汇报结束后，与会老师与同学围绕一维光谱建模优化、模型拓展、实验设计等方面展开交流。

袁阿兰老师建议，可对比MSC多元散射校正、SNV标准正态变量变换等多种预处理方法，筛选最适配粮油拉曼光谱的校正方案；同时可引入一维卷积神经网络等深度学习建模方法，与传统机器学习形成对照，进一步提升低掺量样本的定量精度。

李琳老师提出，CARS算法迭代次数、采样比例等超参数可做网格寻优，进一步提升特征筛选的精准度；同时建议增加不同温度、湿度环境下的对照实验，验证整套方法在复杂环境下的鲁棒性。

林豪发老师从科研规范角度指出，后续应补充模型消融实验，分别验证预处理、CARS特征筛选环节对最终定量结果的提升效果，固化标准化实验方法流程，为后续横向应用与学术成果沉淀打好基础。

参会同学也交流了光谱去噪、参数调优、交叉验证划分等实操方法，分享了化学计量学建模中的常见问题与解决思路。

三、会议总结

杨老师对本次汇报和讨论进行了总结。

会议肯定了当前一维拉曼光谱研究的完整方法体系，从光谱预处理、CARS特征筛选、多模型回归到灰色关联归因，技术路线规范、实验方法成熟，有效解决了高维光谱冗余、定量精度不足、模型可解释性差等问题。

同时明确后续优化方向：一是扩充油脂品类与样本梯度，验证整套方法的通用性；二是多类预处理与特征筛选算法做对比，优选最优组合方案；三是引入深度学习模型丰富建模体系，完善消融实验与参数寻优；四是固化标准化检测流程，推动方法落地到粮油现场快速定量筛查。

图为例会讨论现场

科学研究