聚类分析发现强相关的对象组,而特异检测发现不与其他对象强相关的对象。图3.8K-means聚类方法与CpecuFind发现特异数据能力ROC曲线K-means聚类;CpecuFind表3.6K-means与CpecuFind发现特异数据能力ROC曲线面积对比上述对比说明,只简单地以簇类大小和对象与类心距离来评估对象的特异程度结果很粗糙,其评价特异数据的能力远不如Cpecu Find方法。......
2023-06-16
2000年和2013年两次聚类分析的分类特点基本一致,分类结果有相似之处也有变化较为明显的地方,以下分析造成变动的因素所在。
从分类上看,2013年的聚类结果比2000年多了一类,主要在于重庆、四川两地的异常变化,老龄化程度加剧严重,从倒数第二高一跃成为全国最高水平,而经济发展水平仍旧处于较低位置。第1类由上海变成北京,北京的经济发展水平超过上海成为第一,但老龄化程度相对较好,仅处于相对较低水平。内蒙古由于经济发展水平增长迅速而老龄化水平增速相对缓慢,从第4类上升至第3类中,与东部发达省份广东、福建、浙江接近。甘肃从最后一个分类中上升至倒数第二个分类,并非由于经济发展水平的提高,而是因为老龄化程度的加重程度相较于其他几个西部少数民族省份更严重。
从总体上看,2000年我国老年人口比重和人均GDP呈现出一定的正相关关系,随着人均GDP的增加,老龄化程度加重。但从以上分类中可以看出,广东和福建两省经济发展水平和第3类接近,因为人口年龄结构较为年轻所以聚类分析时被归入第4类中,也显示出单从人均GDP水平来看并不能完全说明老龄化程度是随着经济发展水平的提高而加深。这一变化情况在2013年的聚类结果中反映地更加明显。随着经济水平的进一步提高,大规模的劳动力从中西部省份向东部地区流动,向外输出人口红利,中西部地区的老龄化程度随着经济水平的提高而加重,一些东部地区的老龄化水平却随着经济发展水平的提高而降低或者减速。即从全国纵向发展水平上看,2013年相较于2000年经济发展水平提高的同时老龄化程度加重,但是不同省份间变化的差异程度较大,2013年的分类结果说明经济发展水平和老龄化水平之间的正相关关系大大减弱。
聚类分析发现强相关的对象组,而特异检测发现不与其他对象强相关的对象。图3.8K-means聚类方法与CpecuFind发现特异数据能力ROC曲线K-means聚类;CpecuFind表3.6K-means与CpecuFind发现特异数据能力ROC曲线面积对比上述对比说明,只简单地以簇类大小和对象与类心距离来评估对象的特异程度结果很粗糙,其评价特异数据的能力远不如Cpecu Find方法。......
2023-06-16
图2南四湖上级湖输水水流在风力作用下的水仿值南四湖上级湖输水水流在风力作用下的流场模拟结果给出了网格节点的流速分量和水位值。图3断面3横向水面线图4断面5横向水面线断面3横穿水面较为宽阔的独山湖。航道以东湖区受地形和流速的影响水面线波动较大。......
2023-06-26
聚类的定义与待处理对象特征有关。聚类的方法很多,不同的方法对于同一数据集聚类的结果可能不同。根据层次分解形式的方式,层次聚类方法可划分为凝聚的层次聚类和分裂的层次聚类方法。绝大多数层次聚类方法属于这一类,它们的不同表现在簇内与簇间相似度的定义不同。目前,一般将基于层次的聚类方法和其他聚类技术进行集成以形成多阶段聚类,从而提高聚类质量。它是一种结构辅助聚类的方法,在大型数据库中的速度和伸缩性较好。......
2023-06-16
对于湿法工艺,生产线唯一脱水的地方在薄膜蒸发器,要减少脱水量唯一的途径是使用更高浓度的NMMO溶液,但湿法工艺已经使用了浓度很高的NMMO溶液,因此,要进一步提高NMMO水溶液的浓度会带来输送和安全性等诸多问题。而且,进一步提高NMMO浓度不利于浸渍工艺。......
2023-06-25
Spark MLlib中的K-means算法使用Map分布式读取数据集,并存储在内存里。计算时,用Map键值对表示随机挑选出来的k个聚类中心,Spark的驱动器节点负责把数据发送到各个工作节点,以实现具体的计算任务。Spark MLlib不同于传统的机器学习工具,它提供了简单易用的API,特别是Spark能够高效地处理大数据,并且在迭代计算时具有较强的优势。......
2023-11-21
对纽约市交通事故进行空间热点分析时,选用聚类和异常值分析法对计算出的结果进行挖掘。H区域为西35大街和36大街在第五大道与第六大道中间的路段,从中午12时至下午5时,此区域为交通事故黑点路段。......
2023-06-15
在这个前提下,不论是哪种扩散质,扩散系数都应该是相等的。这种认为动量的扩散和热量、扩散质浓度等扩散之间存在完全的类比关系,其紊动扩散系数相等的假说,称为雷诺比拟。窦国仁 指出,不同扩散质的扩散系数的差异是由于各被携带量在扩散过程中脱离流体质点的速率不同而造成的。针对不同的实验结果提出的解释也是多种多样的。研究表明,当扩散时间较短时,紊动扩散系数随着时间而变化。......
2023-06-22
表5-2不同角色主体的社会资本及其维度的统计由表5-2可知,从不同主体角色的社会资本指数看,组织者社会资本的得分最高,表明组织者拥有较高的社会资本,具有较强的资源动员能力,能够利用自己的资源和资本将农户连接起来,实现农户间的合作,这也是符合常理的。核心农户能够通过社会资本对合作发起进行一系列的宣传、协商,最终对如何进行成本分担、收益分配等问题达成共识。......
2023-06-28
相关推荐