正交基为傅里叶算子时,模板设计过程与上面沃尔什算子基本相同,不同之处在于卷积类型变为循环卷积。傅里叶基设计的特点是可以构造任何大小的内插模板,而不限于2的整数次幂。......
2025-09-29
随着网络信息量的爆炸性增长,推荐系统成为研究热点,个性化新闻推荐得到了人们的重视,个性化新闻推荐系统纷纷出现。目前比较主流的推荐算法有基于协同过滤的推荐和基于内容的推荐等。由于协同过滤是根据用户对新闻的访问记录来进行推荐的,只有被阅读过的新闻才能被推荐,然而新闻的生命周期十分短暂,用户的访问矩阵会相当稀疏,这对于时效性要求比较高的新闻推荐系统是相当严重的缺陷,所以更多采用基于内容的推荐。
基于内容推荐,分别对新闻和用户建模,然后把与用户历史上阅读的新闻相似的新闻推荐给用户。一般来说新闻和用户建模有两种方式:向量空间模型和浅层语义模型。向量空间模型有词袋模型和词频—逆文档概率(term frequency inverse document frequency,TFIDF),浅层语义模型有概率潜在语义索(probabilistic latent semantic indexing,PLSI)和潜在狄利克雷分布(latent Dirichlet allocation,LDA)。
基于内容的新闻推荐一般有以下三个步骤:新闻特征提取,在新闻的内容中抽取一些特征用于结构化表示新闻;用户画像,即用户建模,利用一个用户过去喜欢(不喜欢)的新闻特征数据来学习并判断出此用户的喜好特征;推荐生成,通过计算前面得到的用户画像与候选新闻的特征相似度,为此用户推荐一组用户喜好最相近的新闻。
大多数的基于内容的推荐系统在处理文字类item特征时,都会尝试将一篇文章映射到量空间模型。在模型中,每一篇文章都被表示为一个n维的向量,每一维都对应词典中的一个词,这时文章会被表示成为一个包含每个词的权重的向量。新闻特征向量生成流程如图9-5所示。
(https://www.chuimin.cn)
图9-5 新闻特征向量生成流程
为了得到新闻的特征值,首先要对新闻进行分词处理,将其划分成若干词条的组合。将新闻表示为向量空间模型带来了一个问题,即每个词的权重和向量之间的相似度计算,词频—逆文档概率被普遍用在处理各种自然语言的应用中来解决这个问题。
学习一个用户画像就是为用户建模,在这里它可以被看作一个二值分类过程,每一个文本都被分类为喜欢和不喜欢。因此有了一个分类记号:C={c+,c-},其中,c+表示的是正例文本类,c-表示的是负例文本类,利用用户对新闻的历史数据对新闻画像。
推荐是应用用户画像中得到的分类器应用到未知新闻的过程,通过将用户兴趣预测值高于某一阈值的新闻推荐给用户就可以达到很好的效果。
相关文章
正交基为傅里叶算子时,模板设计过程与上面沃尔什算子基本相同,不同之处在于卷积类型变为循环卷积。傅里叶基设计的特点是可以构造任何大小的内插模板,而不限于2的整数次幂。......
2025-09-29
而基于内容的图像检索需要对一类物体进行匹配,比如检索有汽车、飞机、坦克、人群、楼房的图像,这种情况下就需要对具体的局部特征进行组合优化,从而得到对某类物体的理想化表征——原型。原型匹配理论是这样描述知觉加工的:当一种视觉系统收到一个新刺激,该系统就会将它与原先存储的原型进行比较,但并不要求完全相匹配,事实上大致的匹配就可以了[13]。为了实现从模板匹配到原型匹配的转变,我们引入了相关反馈技术。......
2025-09-29
振动方法对材料无接触、无损伤,但是由于不能直接测量力,其应用仅限于弹性模量的测量。而基于显微镜的轴向加载需要的装置比较复杂。目前已报道了Si[50]、多晶Au[55]、Ag[57,58]、ZnO[53,59]等纳米线的弹性模量的实验结果。......
2025-09-29
要掌握DSP技术,读者除了从本书获取基本知识以外,还要掌握数字信号处理理论,研究控制方法和算法,并进行DSP系统软硬件设计,因此推荐以下书目作为拓展阅读:1)徐科军,等,TMS320X281X DSP原理及应用[M].北京,北京航空航天大学出版社,2006.2)徐科军,等,信号处理技术[M].武汉,武汉理工大学出版社,2001.3)任润柏,等,TMS320F28X源码解读[M].北京,电子工业出版......
2025-09-29
现有的图像检索方式主要分为两种:基于文本的图像检索和基于内容的图像检索。针对以上两点问题,本书对局部特征提取技术和相关反馈技术进行了深入的研究分析,提出了一种基于局部特征的图像检索方法。......
2025-09-29
贝叶斯网络是基于概率分析和图论对不确定性知识进行表示的推理模型,它是一种模拟人类推理过程中因果关系的不确定性处理模型。贝叶斯分类器是用于分类的贝叶斯网络,它是各种分类器中分类错误概率最小或者在预先给定代价的情况下平均风险最小的分类器。通过对纽约市曼哈顿区2014年至2017年的交通事故数据构造朴素贝叶斯网络,对事故中伤亡人数进行分析。图4.1相关性分析结果......
2025-09-29
由第5章内容可知,二维DCT运算可以转化成DFT运算,然后取结果的实部作为DCT变换的结果。DCT基可以设计任何大小的内插模板,而不限于2的整数次幂。以上面傅里叶基构造的结果直接得到DCT基滤波器H和对应的非重叠模板。图8-1c对应的定制H1/3如下,其反变换即为非重叠模板T1/3。......
2025-09-29
不适应类1)生产批量大的零件。2)普通机床难加工,质量也难保证的内容应作为重点选择内容。3)普通机床加工效率低,工人手工操作劳动强度大的内容,可在数控机床尚有加工能力的基础上进行选择。2)加工余量极不稳定,且数控机床上又无法自动调整零件坐标位置的加工内容。此外,在选择和决定数控加工内容时,还要考虑生产批量,生产周期,工序间周转情况等。......
2025-09-29
相关推荐