首页 理论教育大数据挖掘技术及医药应用

大数据挖掘技术及医药应用

【摘要】:数据科学是一门以“数据”,尤其是“大数据”为研究对象,并以数据统计、机器学习、数据可视化等为理论基础,主要研究数据预处理、数据管理、数据计算、数据产品开发等活动的交叉性学科。首先,建立大数据思维方式,学习怎样利用数据;其次,应该了解数据清理、集成、探索等相关技术;最后,洞见和商业意识也至关重要。图1-3数据科学的基本流程

数据科学是一门将“现实世界”映射到“数据世界”之后,在“数据层次”上研究“现实世界”的问题,根据“数据世界”洞见现实解释或决策的新兴科学。

数据科学是一门以“数据”,尤其是“大数据”为研究对象,并以数据统计、机器学习、数据可视化等为理论基础,主要研究数据预处理、数据管理、数据计算、数据产品开发等活动的交叉性学科。

数据科学是一门以实现“从数据到信息”“从数据到知识”和(或)“从数据到智慧”的转化为主要研究目的,以“数据驱动”“数据业务化”“数据洞见”“数据产品研发”和(或)“数据生态系统的建设”为主要内容的独立学科。

数据科学是一门以“数据时代”,尤其是“大数据时代”面临的新挑战、新机会、新思维和新方法为核心内容的,包括新的理论、方法、模型、技术、平台、工具、应用和最佳实践在内的一整套知识体系。

数据科学的知识体系。大数据基础:基本概念、数据洞察、技术架构、应用场景;大数据技术原理:感知采集、存储、管理、计算、分析、可视化;大数据创新实践:创新方法、数据工程、开放数据、行业实践。(www.chuimin.cn)

数据科学的理论基础。大数据表达理论方面,包括大数据的生命周期、演化与传播规律,数据科学与社会学经济学等之间的互动机制以及大数据的结构与效能的规律性;大数据计算理论方面,研究大数据的表示以及大数据的计算模型及其复杂性;大数据应用基础理论方面,研究大数据与知识发现,大数据环境下的实验与验证方法以及大数据的安全与隐私。

数据科学=思维+计算机科学+统计+应用。首先,建立大数据思维方式,学习怎样利用数据;其次,应该了解数据清理、集成、探索等相关技术;最后,洞见和商业意识也至关重要。

图1-3 数据科学的基本流程