产品推荐

高光谱数据特征波长的提取及建模方法介绍

时间：2024-03-14 点击：286次

高光谱成像仪在光谱数据的采集过程中，可以获取到数量庞大的光谱数据。但这些数据中会存在大量的干扰信息，因此就需要对光谱数据进行预处理，以提取出相应的特征波长，建立预测模型。本文对高光谱数据特征波长的提取方法及建模方法做了介绍。

高光谱数据

高光谱数据特征波长提取的原因：

高光谱成像仪检测到的光谱数据由数百个波段组成，能够获得数百个光谱变量，光谱数据量非常大。而且光谱分析时往往需要进行大样本量的获取。因此，光谱数据会显得非常大且冗余，造成后期光谱数据处理分析时效率不高，精度不高，速度下降，提高了对数据处理的配套软硬件要求，同时也不适于未来的工程仪器的应用开发。

为了解决这种问题，就需要寻找有助于建模的特征变量，减少变量个数，提高运算效率，优化预测模型，提高模型预测的精度，同时也有助于开发便携、低成本的仪器。因此需要采用光谱特征波长选择算法来寻找有助于提高模型预测效果的特征波长变量。

高光谱数据特征波长的提取方法：

常用的特征波长提取算法有遗传算法（GA）、竞争性自适应重加杈算法（CARS）、无信息变量消除法（UME）、连续投影算法（SPA）、回归系数法（RC）、Random frog等。高光谱数据分析中没有标准的、唯一的方法选择最佳波长。

1.Random frog方法

基于可逆跳马尔可夫链蒙特卡洛算法，在模型空间中模拟一条服从稳态分布的马尔可夫链，来计算每个变量的被选概率，从而进行变量的选择。

2.CARS方法

模仿达尔文进化论中的“适者生存”法则，利用指数衰减函数和自适应重加权采样技术去除PLSR模型中权重较小的回归系数，优选出权重前几的系数。

3.SPA方法

通过对光谱数据进行一系列的投影映射构造新的变量集，并根据多元线性回归评价模型的预测性能，该变量集中变量的共线性最小。

4.UME方法

向PLSR模型中添加幅度较小的随机变量矩阵，基于交叉验证建立新的PLSR模型。将每个变量系数平均值和标准差的商作为稳定性的值，同随机变量矩阵得到的稳定性的值作比较，选出被认为和随机变量一样对模型建立无效的波长变量。

5.GA方法

模拟生命进化机制，从任意一个初始群体出发，产生一群新的更适应环境的个体，使群体进化到搜索区域中越来越好的区域。

6.RC方法

PLSR建模所得到的模型回归系数，挑选系数绝对值大的作为特征波长。

高光谱数据的建模方法介绍：

由于高光谱数据的复杂以及数据量很大，很难直接的对数据进行定量定性分析，因此需要对提取得到的光谱数据采用化学计量学的方法进行建模分析，对经过特征波长变量提取后的光谱建立多元变量校正模型，比较不同模型的预测效果，选取最优模型，便于以后的仪器开发应用。目前，采用的化学计量学建模算法主要是偏最小二乘回归法（PLSR）和最小二乘支持向量机（LS-SVM）。

1.偏最小二乘回归法（PLSR）

PLSR是一种常见的多元统计方法，广泛应用于光谱检测模型的建立。其原理是将因子分析和回归分析相结合，同时将光谱数据和理化参考数据分解，采用留一法交互验证计算预测残差平方和，再根据潜在变量的累积贡献率和预测残差平方和，寻找最佳的潜在变量个数将光谱数据和理化参考值相关联，建立回归模型。其优点是较好的解决了样本个数少于变量个数的问题。

2.最小二乘支持向量机（LS-SVM）

LS-SVM是一种改进的支持向量机算法，能够快速的进行线性和非线性建棋分析，能有效解决高维数据分析问题，其算法思想是将原始样本数据映射到高维空间里，用等式约束取代不等式约束，在高维空间里对最小化损失函数进行求解获得线性拟合函数。将传统支持向量机的二次规划问题，简化成求解一个等式方程组问题，大大提高计算效率。

上一页 : 光谱数据的预处理方法及光谱特征的提取方法介绍
下一页 : 高光谱成像仪在沙果成熟度检测中的应用