加密技术可以分为加密密钥和加密算法两部分。使用对称密钥加密系统时,发送方用密钥对待发送的数据进行加密得到密文,然后把密文传输给接收方,接收方收到发送方传输来的密文后,使用与发送方相同的密钥对此密文进行解密即可得到明文。图4.37对称密钥加密系统的数据传输过程对称密钥加密技术使用单个密钥对数据进行加密或解密,特点是运算速度快,但密钥分发困难。......
2023-10-22
大数据的宝贵价值成为人们存储和处理大数据的驱动力。《大数据时代》 一书指出了大数据时代处理数据理念的三大转变,即要全体不要抽样、要效率不要绝对精确、要相关不要因果。因此,海量数据的处理和利用是大数据研究的主要目的。
“啤酒与尿布”的故事是大数据挖掘的经典案例。故事发生于20 世纪90 年代的美国沃尔玛超市中,沃尔玛超市的管理人员分析销售数据时发现了一个令人难以理解的现象:在某些特定的情况下,啤酒与尿布这两种看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。
在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两种看上去不相干的商品经常会出现在同一个购物篮中的现象。
如果这个年轻的父亲在卖场只能买到两种商品之一,则他很有可能会放弃购物而到另一家商店,直到可以一次同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物,沃尔玛由此获得了很好的商品销售收入。
从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种类型的数据中,快速获得有价值的信息的能力,就是大数据技术。
大数据分析相比于传统的数据仓库,具有数据量大、查询分析复杂等特点。大数据的特点有4 个:
(1)数据体量巨大,从TB 级别跃升到PB 级别。
(2)数据类型繁多,如网络日志、视频、图片、地理位置信息等。
(3)处理速度快,可从各种类型的数据中快速获得高价值的信息,这一点也和传统的数据挖掘技术有着本质的不同。
(4)只要合理利用数据并对其进行正确、准确的分析,将会带来很高的价值回报。业界将其归纳为4 个“V”—大量(Volume)、多样(Variety)、高速(Velocity)、价值(Value)。
数据中蕴藏的事物之间的关系和发展规律,必须通过数据挖掘来搜寻,数据挖掘实现的主要功能如下:
(1)对数据的统计分析与特征描述。
统计分析与特征描述可对数据本质进行刻画。统计分析主要包括数据的集中趋势分析、数据的离散程度分析、数据的频数分布分析等,常用的统计指标有:计数、求和、平均值、方差、标准差等。如某同学各门课的平均分、同专业同课程不同班级之间的平均成绩分析。(www.chuimin.cn)
(2)关联规则挖掘和相关性分析。
关联规则挖掘和相关性分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。
(3)分类与回归。
分类是通过对一些已知类别标号的数据进行分析,找到一种可以描述和区分数据类别的模型,然后用这个模型来预测未知类别标号的数据所属的类别,例如百度可以根据植物照片来判断它是哪种植物。
回归则是对数值型的函数进行建模,常用于数值预测,如房屋租赁价格预测。
(4)聚类分析。
聚类分析是对未知类别标号的数据进行直接处理。聚类的目标是使聚类内部数据的相似性最大,聚类之间数据的相似性最小。每一个聚类可以看成一个类别,从中可以导出分类的规则,如班主任根据班内同学兴趣的相似性将他们分到对应的兴趣小组。
(5)异常检测或者离群点分析
数据集中包含的一些数据与数据模型的总体特性不一致,称为离群点。离群点可以通过统计测试进行检测,如假定数据服从某一概率分布,看对象是否在分布范围内。也可以使用距离测量,将与任何聚类都相距很远的对象当作离群点。也可以用基于密度的算法来检测局部区域内的离群点。其常用于反作弊、伪基站、金融诈骗等领域的研判。
物联网、云计算、移动互联网、车联网、手机、平板电脑、遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。
大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用。工程和科学问题尚未被重视。大数据工程指大数据的规划、建设、运营、管理的系统工程;大数据科学在大数据网络发展和运营过程中发现和验证大数据的规律及其与自然和社会活动之间的关系。
有关计算机导论(第2版)的文章
加密技术可以分为加密密钥和加密算法两部分。使用对称密钥加密系统时,发送方用密钥对待发送的数据进行加密得到密文,然后把密文传输给接收方,接收方收到发送方传输来的密文后,使用与发送方相同的密钥对此密文进行解密即可得到明文。图4.37对称密钥加密系统的数据传输过程对称密钥加密技术使用单个密钥对数据进行加密或解密,特点是运算速度快,但密钥分发困难。......
2023-10-22
Malachite孔雀石是一种碱式碳酸铜矿物,产于铜矿床的氧化带,常与蓝铜矿、赤铜矿共生。孔雀石属三斜晶系,通常呈块状、放射状、钟乳状、肾状、皮壳状等。高品质的孔雀石应为结构致密,条带花纹清晰,呈亮丽的孔雀绿。19世纪初期,俄国乌拉尔山地区发现了世界最大的孔雀石矿,大量孔雀石被运往欧洲,最大的一块集合体重达56吨。中国广东阳春出产丰富的孔雀石矿和可用于首饰的宝石级孔雀石。......
2023-08-18
按照成形工艺的不同,铜及其合金可分为铸造铜合金和变形铜合金两大类。只含锌的铜锌二元合金称为普通黄铜,是航空领域应用最为广泛的结构铜合金。表4-1 铸造铜合金牌号及化学成分注:1.布氏硬度试验力的单位为牛顿。铍青铜是wBe≈2%的铜合金,具有高的强度、硬度、弹性、耐磨性、耐寒性和抗应力松弛性,用于制造航空仪器仪表,还可用于......
2023-06-22
② 乙醇含氧量高达34.7%,添加10%的乙醇,燃料氧含量可达3.5%。若在辛烷值相同的前提下,发动机的动力性能也会因乙醇的含量增加而有不同程度的下降。但是,由于辛烷值高,如果采用专门设计的高压缩比发动机,燃烧的热效率就会有所提高,可以适当补偿热值低的缺陷。一般最高使用E85 乙醇汽油,即含85%的乙醇和15%的汽油的混合燃料。世界上使用乙醇最多的是E22 乙醇汽油。图7-2-2乙醇燃料汽车......
2023-08-20
AutoLISP同样还有很多其他的数据类型,如点对,文件描述符,选择集等,本书第1章已经对点对等数据类型做了初步介绍。文件描述符是指向AutoLISP所打开文件的一个标识符,相当于高级语言的文件号。当AutoLISP的函数需要向文件写入数据或从文件中读出数据时,都要用这个文件描述符来指向文件。由于选择集可以保存在AutoLISP的变量中,这就使我们可以在图元的选择集上工作。在系统内部,AutoCAD将对象作为图元看待。......
2023-11-02
DSP微处理器是为了满足数字信号处理及实时控制而制造的一类微处理器,具有特殊的芯片架构与指令集,有如下特点:1)多总线结构。DSP设置了专用的硬件乘法器,一次或多次乘法累加运算可以在一个指令周期内完成。同时处于激活状态的指令数与DSP芯片流水线的深度有关。DSP芯片采用上述哈佛结构、流水线操作,并设计了专用的硬件乘法器和特殊DSP指令,使得DSP芯片的指令周期能够达到数十纳秒至几纳秒。......
2023-06-24
主要的铸造铝合金分类、性能特点及用途见表1-1。表1-1 主要的铸造铝合金分类、性能特点及用途表1-2 铸造铝合金的牌号及其化学成分表1-3 铸造铝合金杂质允许含量表1-3 铸造铝合金杂质允许含量①砂型铸造。表1-5 变形铝合金分类、性能特点及用途注:除有范围的元素和铁为必检元素外,其余元素在有要求时抽检。这类合金由于具备良好的耐蚀性,故称为防锈铝。变形铝合金按其成分和性能特点又可分为不能热处理强化铝合金和可热处理强化铝合金。......
2023-06-22
1.异步电机结构交流异步电机主要有单相和三相两种形式。图6-1-3交流异步电机的典型结构图6-1-4电刷装置与外电路相连图5)其他部分其他部分包括端盖、风扇等。2.异步电机原理电动汽车上需要利用电机对车辆进行制动、减速,并回收汽车的惯性能量,这一功能由电机来实现。相比于直流电机,交流异步电机转子的结构很简单,结构尺寸小,质量轻。交流异步电机的控制相对较为复杂,配用的控制器的成本较高。......
2023-08-27
相关推荐