图像质量评估不同于传统意义上的图像识别,其本身是一项主观性较强的任务,无法单纯通过评判准确性来衡量算法模型的性能。其性能好坏通常是评估主观评分和算法评分的相关度,如果两者相关度较高,则说明质量评估算法性能较好,反之则较弱。
常用的用于图像质量评估的指标主要有四个:PLCC,SROCC,KROCC 和 RMSE。
1. PLCC
关于 PLCC(Pearson Linear Correlation Coefficient)皮尔逊线性相关系数的解读,可参考博主另一篇博客:如何通俗易懂地理解皮尔逊相关系数?。
需要注意的是,在没有特殊说明的情况下,PCC=LCC=PLCCPCC=LCC=PLCCPCC=LCC=PLCC。
2. SROCC
SROCC(Spearman Rank Order Correlation Coefficient)Spearman 秩序相关系数被认为是最好的非线性相关指标。其计算的是排序后变量的 PLCC,设有两组序列 X 和 Y,其秩序为 R(X) 和 R(Y),则
SROCC(X,Y)=PLCC(R(X),R(Y))SROCC(X, Y) = PLCC(R(X), R(Y))SROCC(X,Y)=PLCC(R(X),R(Y))
SROCC 用于衡量秩序的相关性,只与序列中元素的排序有关,因此 X 和 Y 被任何单调非线性变换作用(如对数、指数等)都不会对其值造成任何影响,这与 PLCC 不同,后者只有在变量之间具有线性关系时才是完全相关的。
3. KROCC
KROCC(Kendall Rank Order Correlation Coefficient)Kendall 秩序相关系数判断的是数据的和谐程度,其值为同序对和异序对之差与总对数 (n*(n-1)/2) 的比值。不太好理解,举个例子:
同序对:
对学生1,其性别小于学生5,身高也小于学生5,则学生1和5是一致的一对。
同理,学生1与学生3也能结成一致性的一对,这时一致性对数等于2。
对学生6,其一致性对数为2,以此类推,总的同序对为4.
异序对:
对学生1,其性别小于学生4,身高大于学生4,则学生1和4是不一致的一对。
同理,学生6和学生4也能结成不一致的一对。以此类推,总的异序对为4。
总对数为15,KROCC = (同序对数-异序对数)/ 总对数 = (4-4) / 15 = 0。
由于数据是随意填写的,这里显示出在该样本情况下性别与身高没有相关性。
4. RMSE
RMSE(Root Mean Square Error)均方根误差比较容易理解,其计算方式为主观评分与算法评分偏差的平方和与评分次数 m 比值的平方根,:
RMSE(X,Y)=∑1m(Xi−Yi)2mRMSE(X, Y)=\sqrt{\frac{\sum_1^m(X_i-Y_i)^2}{m}}RMSE(X,Y)=m∑1m(Xi−Yi)2
RMSE 用于衡量算法评分值与主观评分值之间的偏差,其对异常值较敏感,偏差越小即算法性能越好。
如果觉得《图像质量评估常用评价指标总结》对你有帮助,请点赞、收藏,并留下你的观点哦!