首页 理论教育基于混淆矩阵的精度评价实证研究

基于混淆矩阵的精度评价实证研究

【摘要】:混淆矩阵是通过将每个地表真实像元的位置和分类与分类图像中的相应位置和分类进行比较计算得到。Kappa系数是反映整个误差矩阵的精度系数,可以测试分类结果与参照图之间的吻合度。分别对2001 年、2004 年、2007年、2012年的青岛大沽河流域土地利用/土地覆盖分类结果选取验证点 做误差矩阵,分析后得出精度评价各主要指标及Kappa系数。

在现有研究中,衡量遥感分类精度最常用的方法是由Congalton提出的误 差矩阵(error matrix),也称混淆矩阵(confusion matrix),它是一种用于表示精度评价的标准格式,基本评价指标有总体精度(overall accuracy)、制图 精度(producer's accuracy)、用户精度(user's accuracy)与Kappa系数等。

混淆矩阵:主要用于比较分类结果和地表真实信息,可以把分类结果的精度显示在一个混淆矩阵里面。混淆矩阵是通过将每个地表真实像元的位置和分类与分类图像中的相应位置和分类进行比较计算得到。混淆矩阵的每一列代表了一个地表真实分类,每一列中的数值等于地表真实像元在分类图像中对应于相应类别的数量,有像元数和百分比两种表示。

总体精度等于被正确分类的像元总和除以总像元数,地表真实图像或地表真实感兴趣区限定了像元的真实分类。被正确分类的像元沿着混淆矩阵的对角线分布,它显示出被分类到正确地表真实分类中的像元数。像元总数等于所有地表真实分类中的像元总和。

制图精度指某类被正确分类的概率,对应的误差为漏分误差(omission errors);用户精度指被分为某一类中的像素被正确分类的比率,与之对应是 错分误差(commission errors)。

Kappa系数是反映整个误差矩阵的精度系数,可以测试分类结果与参照图之间的吻合度。它是通过把所有地表真实分类中的像元总数乘以混淆矩阵对角线的和,再减去某一类中地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果,再除以总像元数的平方差减去某一类中地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果所得到的,其计算公式为

图7.2 2012年大沽河流域数据验证选点分布图

式中:K 为Kappa系数;r 为误差矩阵的列数(即总类别数);xii为误差矩阵第i 行i 列的像元数;xi+和x+i分别为分类误差矩阵的总行数及总列数;N 为采样总数。

分 别 对2001 年、2004 年、2007年、2012年的青岛大沽河流域土地利用/土地覆盖分类结果选取验证点(验证点分布图见图7.2) 做误差矩阵,分析后得出精度评价各主要指标及Kappa系数(表7.2~表7.9)。

表7.2 2001年大沽河流域土地利用/土地覆盖分类精度误差矩阵

表7.3 2001年大沽河流域土地利用/土地覆盖分类精度评价

表7.4 2004年大沽河流域土地利用/土地覆盖分类精度误差矩阵

表7.5 2004年大沽河流域土地利用/土地覆盖分类精度评价

表7.6 2007年大沽河流域土地利用/土地覆盖分类精度误差矩阵

表7.7 2007年大沽河流域土地利用/土地覆盖分类精度评价

表7.8 2012年大沽河流域土地利用/土地覆盖分类精度误差矩阵

表7.9 2012年大沽河流域土地利用/土地覆盖分类精度评价

从大沽河流域土地利用/土地覆盖分类图中,研究区内各种土地利用/土地覆盖的空间分布来看,地类分布集中的区域其分类准确程度较高,但土地利用/土地覆盖复杂,地块中存在多种地类交错分布的情况,容易造成误分、漏分现象。 精度评价表明,基于MODIS数据的大沽河流域土地利用/土地覆盖分类结果较为准确。