研究目的
提出一种基于卷积神经网络的新型端到端建模方法,直接使用原始光谱数据而无需波长选择预处理,从而简化红外光谱定量分析流程。
研究成果
提出的基于CNN的端到端建模方法通过消除手动波长选择的需求,简化了近红外光谱定量分析流程。该方法在使用全光谱数据时优于传统方法,与采用波长选择的方法相比表现相当,更易于使用且适合初学者操作。未来工作应聚焦于抽象特征解释及特征选择优化。
研究不足
CNN提取的抽象特征难以进行物理解释,且与传统时域或频域特征的关系尚不明确。由于并非所有提取的特征都有用,因此需要进行特征选择,但在特征降维与模型性能之间保持平衡仍具挑战性。本研究仅限于玉米近红外数据集,在未经进一步验证的情况下可能无法推广到其他数据集。
1:实验设计与方法选择:
本研究设计了一种基于卷积神经网络的近红外光谱定量分析模型,采用一维卷积神经网络自动从原始光谱数据中提取特征,无需人工波长选择。模型拓扑结构包括输入层、卷积层、激活函数层、全连接层和输出层,通过试验优化参数。
2:样本选择与数据来源:
使用公开的玉米近红外数据集,包含80个样本(采用mp5光谱仪扫描,波长范围1100-2498 nm,2 nm间隔,700个通道)。数据集划分为60个训练样本和20个测试样本,目标成分为水分、油脂、蛋白质和淀粉。
3:实验设备与材料清单:
玉米近红外数据集来自Eigenvector Research公司(http://www.eigenvector.com/data/Corn/)。建模在MATLAB R2017b中实现,使用神经网络和机器学习工具箱。
4:实验流程与操作步骤:
CNN模型采用特定参数实现(如核尺寸201、移动步长101、50个卷积核、ReLU激活函数)。使用训练集进行训练,通过均方根预测误差(RMSEP)和决定系数(R²)评估测试集的泛化性能。与传统方法(PLS、BP神经网络、ELM)及结合波长选择算法的方法(iPLS、GA、L1正则化)进行比较,采用10折交叉验证消除随机因素影响。
5:移动步长50个卷积核、ReLU激活函数)。使用训练集进行训练,通过均方根预测误差(RMSEP)和决定系数(R²)评估测试集的泛化性能。与传统方法(PLS、BP神经网络、ELM)及结合波长选择算法的方法(iPLS、GA、L1正则化)进行比较,采用10折交叉验证消除随机因素影响。
数据分析方法:
5. 数据分析方法:采用预测均方根误差(RMSEP)和决定系数(R²)评估性能,通过配对t检验(置信水平0.05)检验统计显著性。进行特征可视化和选择以分析提取的抽象特征。
独家科研数据包,助您复现前沿成果,加速创新突破
获取完整内容