全国服务咨询热线:

15000590832

当前位置:首页  >  技术文章  >  红外应用|聊聊光谱相关性

红外应用|聊聊光谱相关性

更新时间:2025-07-11      点击次数:30

作为红外光谱QC人员,在日常工作中最常用的一项任务就是确认所采集的样本红外光谱是否和标准样本一致,或者在对未知物进行确认时,需要从海量的标准光谱库中寻找到最佳匹配的样本,这个时候往往就需要一个方法来评判。


这个方法我们通常使用光谱“相关系数”或者“匹配系数”,也有称之为“HQI”(相似度指标)来衡量。这里有两个核心问题:(1)两张光谱“相关性”怎么计算?(2)“相关性”达到多少算好?


图1是荧飒光学公司S-IR软件中未知样本光谱在光谱库中进行检索的示例,根据 “相关系数”计算,软件给出了最为匹配的可能物质是聚苯乙烯,其相关系数达到88.98%。


图片1.png

图1  谱库检索

 

下面我们简单聊聊这个过程,看看有没有豁然开朗的感觉。


如图2,有一个未知样本光谱和两张标准样本光谱,假设每张光谱只由三个波长点组成,分别是未知样本[1, 2, 3],标样1[1.2, 2.1, 2.8]和标样2[2, 2.5, 1.8],将其绘制在3D坐标系中,肉眼可见,未知样本和标样1靠的很近,和标样2相隔很远。我们就可以轻而易举地给出判断和结论。但当光谱从3个波长点扩展到N个点(比如4000-400cm-1)时,这时候人脑和肉眼就根本不够用了,只能借助算法来计算,并给出判断结果。


图片2.png

图2


两张光谱之间的相关系数用于衡量它们之间的相关程度,常用的方法是皮尔逊相关系数(Pearson correlation coefficient),在光谱分析中,即两张光谱对应波长处的强度值之间的线性关系。通常其取值范围在[-1,1]之间:


为了便于理解,我们通常取绝对值来表达其相关性强度。


假设有两张光谱,分别为 X=[x1,x2,...,xn] 和 Y=[y1,y2,...,yn],它们的皮尔逊相关系数的计算公式为:


图片5.png


是不是有点眼熟?妥妥的就是平常使用的最小二乘法嘛。恭喜你答对了!


我们将图2中的未知样本和两个标样计算一下,相关系数分别0.99和0.27,所以也验证了我们肉眼的准确性。除了皮尔逊相关系数之外,还有其他很多类似的算法,比如欧式距离法、马氏距离法、夹角余弦距离法等等,匹配值在有些软件中也就会变成最大到999。不一而论,主要思想都差不多。


 

下面关于第二个问题,则比较主观了,需要根据自己实验室要求来做确定。小编在此给一个参考,在制药领域中,通常将最小HQI设置为0.95,以此来判定未知样品与标准图谱是否匹配。

全国统一服务电话

021-59130260

电子邮箱:2488329935@qq.com

公司地址:上海市嘉定区沪宜公路1101号越界产业园区

关注公众号