首页 理论教育数据库技术应用教程:数据挖掘技术

数据库技术应用教程:数据挖掘技术

【摘要】:近年来发展起来的数据挖掘技术及其产品已经成为数据仓库开采的有效工具。数据挖掘技术涉及数据库技术、人工智能技术、机器学习、统计分析等多种技术,它使决策支持系统跨入了一个新的阶段。传统的DSS系统通常是在某个假设的前提下,通过数据查询和分析来验证或否定这个假设。有关数据挖掘技术的研究已经从理论走向了产品开发,其发展速度是十分惊人的。能够使用数据挖掘工具已经成为能否在市场竞争中获胜的关键所在。

数据仓库如同一座巨大的矿藏,有了矿藏而没有高效的开采工具是不能把矿藏充分开采出来的。数据仓库需要高效的数据分析工具来对它进行挖掘。20世纪80年代,数据库技术得到了长足的发展,出现了一整套以数据库管理系统为核心的数据库开发工具,如FORMS、REPORTS、MEHUS、GRAPHⅠCS等,这些工具有效地帮助数据库应用程序开发人员开发出了一些优秀的数据库应用系统,使数据库技术得到了广泛的应用和普及。人们认识到,仅有引擎是不够的,工具同样重要。近年来发展起来的数据挖掘技术及其产品已经成为数据仓库开采的有效工具。

数据挖掘(Data Mining,DM)是从超大型数据库或数据仓库中发现并提取隐藏在内部的信息的一种新技术,其目的是帮助决策者寻找数据间潜在的关联,发现被经营者忽略的要素,而这些要素对预测趋势,决策行为可能是非常有用的信息。数据挖掘技术涉及数据库技术、人工智能技术、机器学习、统计分析等多种技术,它使决策支持系统(DSS)跨入了一个新的阶段。传统的DSS系统通常是在某个假设的前提下,通过数据查询和分析来验证或否定这个假设。而数据挖掘技术则能够自动分析数据,进行归纳性推理,从中发掘出数据间潜在的模式,数据挖掘技术可以产生联想,建立新的业务模型帮助决策者调整市场策略,找到正确的决策。

有关数据挖掘技术的研究已经从理论走向了产品开发,其发展速度是十分惊人的。在国外,尽管数据挖掘工具产品并不成熟,但其市场份额却在增加,越来越多的大中型企业利用数据挖掘工具来分析公司的数据。能够使用数据挖掘工具已经成为能否在市场竞争中获胜的关键所在。(www.chuimin.cn)

总之,数据仓库系统是多种技术的综合体,它由数据仓库、数据仓库管理系统和数据仓库工具3部分组成。在整个系统中,数据仓库居于核心地位,是信息挖掘的基础;数据仓库管理系统是整个系统的引擎,负责管理整个系统的运转;而数据仓库工具则是整个系统发挥作用的关键,只有通过高效的工具,数据仓库才能真正发挥出数据宝库的作用。