图12-4刀具磨损曲线监测信号的处理分析以及特征的提取是刀具状态监测的关键技术之一。近年来越来越多的学者利用BP神经网络来研究刀具磨损检测技术问题,利用人工神经网络预测刀具磨损是可行的也是科学的。以高速铣削过程中刀具的磨损状态为研究对象,利用刀具在不同磨损状态下的铣削力信号对不同监测技术进行研究,建立了基于BP神经网络预测......
2023-06-28
目前已有的工作大多基于浅层模型进行搜索广告的点击率预测,浅层模型在特征学习方面是直接使用统计学习方法计算得到的特征,特征中每一维的含义固定并且孤立,不能表达内部之间的关系。本案例的目标是通过给定的信息预测搜索广告的点击率,通过使用深度学习模型,挖掘更多的特征之间的关系,从而能更有效地提高预测的结果。
我们采用的数据集为KDD Cup2012中Track2提供的,该数据由腾讯公司下的搜索品牌搜搜(SOSO)搜索引擎提供,因为涉及公司商业信息,数据经过哈希处理。由于数据量过大并且正负样本不平衡,故而采用随机采用的方法,从训练集中抽取10%作为本案例模型训练的训练集,即使用随机函数生成对应的样本序号,抽取出对应的样本,这样既缩小了样本空间,同时随机采样也保持了原始数据的分布信息。我们分别对AdIDas、AdvertiserID、QueryID、KeywordID、TitleID、DescriptionID、UserID、DisplayURL这8个属性进行了特征扩展,最终得到的特征维度超过千万,虽然维度非常高,但非零值只有8个,称之为类别稀疏特征。
深度神经网络与浅层学习模型相比,浅层学习模型的学习能力表达有限,尤其是在复杂函数分类问题上,浅层学习模型的泛化能力非常有限,而面对复杂的函数,深度神经网络的参数则比较简洁,能更好地完成对特征的学习。深度神经网络是深度学习中最为简单的模型,它由多层人工神经网络的堆叠而成,与浅层学习模型对比,在表达复杂函数时,深度神经网络使用的参数更少更简洁,更好地完成对特征的学习。为了防止过拟合,可采用dropout方法来解决,并利用多计算单元集成的GPU来提高模型训练的速度。
然而,深度神经网络虽然在一定程度上刻画出了特征之间的关系,但却比较粗糙,并没有从局部到整体的认识层次来学习特征。本案例对基于CNN的CTR预测进行研究,通过卷积与亚采样操作的结合,能更好地学习出数据特征之间的关系,不仅解决了线性模型无法模拟真实广告数据场景的问题,也解决了一般非线性模型无法深入挖掘特征相互关系的问题,并且较之于传统的神经网络,CNN能更好地理解特征之间的关系。基于CNN的广告点击率预测模型结构如图7-9所示。
图7-9 CNN在搜索广告点击率中的应用
预测模型分别设置了一层输入层、两层卷积层、两层亚采样层、一层全连接层和一层输出层。
首先,从样本数据提供的历史日志中提取相应的特征,构建得到输入,对局部感受野即卷积的窗口大小进行设置,并设置好窗口滑动的步长,然后对输入特征进行卷积操作。每一次卷积是将局部感受野中的所有值与卷积滤波器相进行加权求和,然后通过激活函数进行求值的过程,其实质相当于对窗口内所有值的组合,因此卷积过程相当于特征融合过程。经过卷积操作后得到的结果作为输入传递给亚采样层。在亚采样层,同样需要先设定好亚采样窗口的大小,以及窗口滑动步长,多数情况下,在亚采样层的窗口滑动不是重叠的,即滑动的步长等于窗口的长度。设置亚采样的参数后进行亚采样操作,即选取窗口中值最大节点值的代表整个窗口的输出值,可以理解为选取出窗口中的最优表达能力的特征值来表示整个窗口的特征,因此亚采样过程相当于特征的萃取过程。亚采样的输出将作为输入传递给下一层卷积层,此后的卷积操作和亚采样操作安装前面叙述的过程以此进行。随后,将特征经过两层卷积层和两层亚采样层后得到的输出作为输入传递给全连接层。在全连接层,上一层亚采样的结果不再按照局部窗口进行计算,而是将它们全部展开。最后,全连接层与输出层进行全连接,得到最终的预测结果。
具体地,本案例主要包含如下三方面的研究内容:第一,本文从搜索广告点击率预测的定义出发,分析了数据集的数据的分布和特点并对数据集进行了预处理,在此基础上,本案例根据对搜索广告的认识和在实际应用中的特性,提取了六类不同的特征;第二,使用基于深度神经网络模型的搜索广告点击率预测的方法,我们使用dropout方法来降低在训练时过拟合造成的影响,实验结果表明,在特征相同的情况下,本案例使用的深度神经网络模型方法能取得比主流方法更好的预测结果;第三,本案例利用了面向搜索广告点击率预测的卷积神经网络模型,通过基于局部窗口概念的卷积操作和亚采样操作,完成了从局部到整体的特征学习。
在KDD Cup 2012中Track 2数据集上的实验结果表明,本案例所使用的基于CNN的搜索广告点击率预测的方法能有效地提高点击率预测的结果。
有关工业智能技术与应用的文章
图12-4刀具磨损曲线监测信号的处理分析以及特征的提取是刀具状态监测的关键技术之一。近年来越来越多的学者利用BP神经网络来研究刀具磨损检测技术问题,利用人工神经网络预测刀具磨损是可行的也是科学的。以高速铣削过程中刀具的磨损状态为研究对象,利用刀具在不同磨损状态下的铣削力信号对不同监测技术进行研究,建立了基于BP神经网络预测......
2023-06-28
智能维护技术是设备状态监测与诊断维护技术、计算机网络技术、信息处理技术、嵌入式计算机技术、数据库技术和人工智能技术的有机结合,其主要研究领域包括以下几个方面:远程维护系统架构和网络技术研究。多通道同步高速信号采集技术与高可靠性监测技术的研究。......
2023-06-23
广告有多少限制既然广告能创造名牌,能为广告主带来巨大的经济利益,那么,是不是广告就可以随便做了呢?为了规范广告活动,保护消费者的合法权益,国家作出了许多法律规定,实际上就是对广告可以怎么做、不可以怎么做的一些限制。对成语使用的限制只是许多广告限制的一种。所以,当按照广告的指引购买商品时,我们的合法权益受《广告法》和其它有关法规的保护。......
2024-01-21
按照0.9的排放率,南沙河流域2020年点源污水量约为20.78万m3/d。非点源污染负荷预测。考虑目前南沙河流域内监测资料较少,本次规划中的非点源污染量计算采用国家环境保护总局下发的《全国水环境容量核定技术指南》提供的输出系数法经验模型,分农业、生活和城市径流污染三方面计算非点源污染负荷,计算方法见式和式。将城市径流和农业污染累加得到一年内非点源污染输入量,南沙河干流年入河COD113.4t以及氨氮22.7t。......
2023-06-26
用不同的分类方法对预测技术进行分类:按预测技术的属性来划分 预测技术可分为定性预测技术和定量预测技术。定性预测的主要特点如下:①应用起来灵活方便。③定性预测所需要的时间比较短,时效性较强。④缺点是预测结果受主观因素的影响较大。3)科技预测,对科学技术问题预测。按预测期限长度分1)近期预测。指3个月以内预测。它是制定年度计划、季度计划和明确规定短期经济活动具体任务的依据。......
2023-07-15
不过,仅凭单根K线,投资者有时很难找寻影响未来股价走势的信息,若能将多根K线组合在一处,同时辅之以其他技术分析工具,则可以更加容易地判断股价运行的趋势和方向。K线组合研判的方法包括以下两种。该形态的出现说明股价将结束下行,反向上攻。这三根K线共同组成了早晨之星形态。图1-20 斯莱克日K线走势图2015年5月至6月,斯莱克的日K线走势图上出现了M形顶形态。6月10日,斯莱克的股价在下跌过程中获得支撑而反弹。......
2023-08-08
1.搜索引擎技术原理搜索引擎有三步。但即使最大的搜索引擎建立的索引数据库,仍占互联网上不到30%的普通网页,不同搜索引擎之间的网页数据重叠率一般在30%以下。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的网页。同时,市场需求的多元化也导致了搜索引擎的发展格局必然是行业化和细分化。......
2023-11-01
一项卓有成效的广告项目的开发运作,包括设定广告目标、决定广告预算、设计广告信息、选择广告媒介、约定发布时间、评估广告成效几个步骤。如果博物馆已经到了门庭若市、人满为患的程度,博物馆经营者就会缩减广告开支。......
2023-08-09
相关推荐