首页 理论教育大数据的特征:大容量、多样化与模糊性-智慧旅游管理研究

大数据的特征:大容量、多样化与模糊性-智慧旅游管理研究

【摘要】:(一)大容量大容量是大数据区分于传统数据最显著的特征。(二)多样化多样化主要说的是大数据的结构属性,数据结构包括结构化、半结构化、准结构化和非结构化。半结构化数据具有一定的结构性,但没有严格的模型、程式和关系,其数据结构变化很大,不能通过简单的模型对数据进行直接应用。大数据主要面向半结构化数据和非结构化数据。在大数据处理过程中模糊性也会带来巨大的影响。

(一)大容量

大容量是大数据区分于传统数据最显著的特征。传统的数据处理没有处理足量的数据,并不能发现很多数据潜在的价值;大数据时代随着数据量和数据处理能力的提升,使从大量数据中挖掘出更多的数据价值变为可能。互联网的发展、移动互联网的广泛应用、社交网络的兴起、自媒体的产生,使得人们能够通过电脑手机、微博、微信、空间等各种平台、渠道、终端实现信息的获取和传播,在此过程,将产生大量的数据。这些数据通常能够到达TB(1TB=1024GB,以下依次类推)、PB、EB、ZB、YB、BB、NB、DB甚至更大的级别。

(二)多样化

多样化主要说的是大数据的结构属性,数据结构包括结构化、半结构化、准结构化和非结构化。结构化数据是指通过一定的组织安排、程序设计和规定算法收集到的数据,这类数据具有明确的层次结构和逻辑关系,能够与其他数据直接进行交换、计算,并且这类数据具有一定的操作规范,数据的收集、处理和应用较为简单。半结构化数据具有一定的结构性,但没有严格的模型、程式和关系,其数据结构变化很大,不能通过简单的模型对数据进行直接应用。非结构化数据是与结构化数据相对而言的,这类数据突破关系数据库中数据结构和限制因素,在处理连续数据方面有着结构化数据无可比拟的优势。大数据主要面向半结构化数据和非结构化数据。按照数据载体的不同,大数据可以分为图片、文字、数字、声音、视频、符号等;按照产生对象的不同,可以分为个人、企业、组织、政府等;按照产生场所的不同,可以分为生活数据、消费数据、工作数据等。

(三)快速率

从数据产生的角度来看,数据产生的速度非常快,很可能刚建立起来的数据模型在下一刻就改变了。从数据处理的角度来看,在保证服务和质量的前提下,大数据应用必须要讲究时效性。因为很多数据的价值随着时间在不断地减少。(www.chuimin.cn)

(四)价值性

大数据的价值性可以从以下两方面进行理解:数据质量低,数据的价值密度低。各种不同类型的数据,都有特定的来源。例如,人们在网上消费中对商品信息的浏览,人们在运用手机查看新闻时所处的时间段,这些看似单体分散的数据,实际是对人们生活、消费、工作等的真实描述,而行为、信息、数据的产生自然有其内在联系,也就因此内含了其中的逻辑。数据是行为的表现,将这些数据集中起来,并以特定的方法进行组织、推理、测算,便可发现其中的规律,对这些规律进行充分的开发和应用,即可实现数据的价值。

(五)模糊性

采集手段的多样化、传感器本身监测精度与范围的局限性、监测信息变化的非线性和随机性、自然环境的强干扰性等,使采集到的数据具有模糊性。在大数据处理过程中模糊性也会带来巨大的影响。因此,数据的挖掘和清洗、算法的模型和因子选择、机器训练等就变得很关键