首页 理论教育大数据挖掘技术在医药领域中的特征提取成果

大数据挖掘技术在医药领域中的特征提取成果

【摘要】:以打鼾声声音特征提取为例,在基于机器学习的生物医学数据分析中,特征提取在大量医学数据中显得十分繁重而耗时。于月娜对宫颈细胞进行了图像分割和特征提取的研究。在对宫颈细胞特征提取方面的研究中,选取了合适的形状与纹理特征,通过KMeans算法进行深入研究。任丽晔对表面肌电信息进行特征提取,对不同的特征向量进行对比,选择最佳的特征向量,基于小波变换的特征提取反映信号局部性信息和时段信号变化的剧烈程度。

特征提取的传统方法是手工制作特征,而手工设计有效的特征是一个漫长的过程。深度学习与传统方法相比,优势在于其能自动地从大数据中学习特征而不是采用手工制作的特征。手工制作的特征主要依赖于设计者的先验知识,很难充分利用大数据。深度学习可以自动从大数据中学习特征表示,并包括数以万计的参数。通过对大数据下的网络特征提取方法进行分析,在对大数据时代发展现状、社会需求、生活方式及其条件下的网络信息提取方法分析的基础上,研究提高大数据时代下,面向知识发现的网络信息特征提取方法的可行性以及最大效率性。

李雪菲在《大规模结构化数据特征抽取》一文中提到应用哈希函数对数据进行键值化处理,并在其中加入了统计和归一化方法,实现了主成分分析法用于提取降维数据。采用过滤式方法用于特征选择,采用数学操作和离散型特征编码的方法用于特征生成。

国外人们使用GPU加速生物医学信号处理。以打鼾声声音特征提取为例,在基于机器学习的生物医学数据分析中,特征提取在大量医学数据中显得十分繁重而耗时。Jian Guo的研究中,通过python使用图形处理单元从大量的打鼾声声音数据中提取特征。Vitaly Schetinin提出可以通过睡眠脑电图来提取特征,从而分析评价大脑的发育。他表示,在新生儿大脑发育评估的情况下进行贝叶斯评估和预测分布的评价,拟议的功能与大脑的成熟度高度有关。

于月娜对宫颈细胞进行了图像分割和特征提取的研究。他在文中进行了宫颈细胞图像的语义描述、宫颈细胞图像的分割与图像的特征提取三个方面的内容。在宫颈细胞图像分割方面提出了一种高效的分层次分割算法,就如何提高宫颈细胞核质分离的准确率和分割效率,提出了一种基于Grab Cut算法、结合Canny算法边缘检测的方法来分离宫颈细胞核与细胞质。在对宫颈细胞特征提取方面的研究中,选取了合适的形状与纹理特征,通过KMeans算法进行深入研究。(www.chuimin.cn)

医学图像特征提取研究在不断发展。张增对脊柱图像也进行了特征提取,他提到对图像进行预处理能够获取更好的图像处理效果,随后进行图像分割、图像去噪、图像增强,最后进行图像特征提取。特征提取中包括图像颜色、纹理、形状和空间关系四个方面。

任丽晔对表面肌电信息进行特征提取,对不同的特征向量进行对比,选择最佳的特征向量,基于小波变换的特征提取反映信号局部性信息和时段信号变化的剧烈程度。研究中将小波分解系数作为描述信号特性的特征向量。