首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
以网络为基础的网络社会包含海量新闻信息,基于内容语义的新闻推荐成为迫切需求。针对上述目的以及社会网络中新闻推荐方法的独特性,改进了基于社会网络的新闻推荐模型。利用历史新闻中人们的新闻相似性、浏览时间、浏览次数、外推行为以及评价等指标,发掘和构建了社会网络中人与人之间的朋友关系,并把它与个人历史浏览记录结合,计算当前新闻的综合推荐度,从而进行推荐。实验表明,该方法改进了社会网络中的新闻推荐,能更好地向用户推荐新闻。  相似文献   

2.
基于词元再评估的新事件检测模型   总被引:1,自引:0,他引:1  
张阔  李涓子  吴刚  王克宏 《软件学报》2008,19(4):817-828
新事件检测(new event detection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻.初步实验发现,在对不同类别的新闻报道进行新事件检测时,其不同类型的词元往往具有不同的敏感程度.而传统方法往往将所有的词元等同看待.重点研究在新事件检测模型中,对于不同词元的权重设定问题.提出利用统计方法优化不同类别新闻对于不同词性词元的权重参数;提出利用已有新闻簇信息动态更新词元权重的方法,采用在新闻之间(而非新闻与新闻簇之间)计算相似度的形式,发挥两种比较形式的优点.在Linguistic Data Consortium(LDC)公共数据集TDT2与TDT3上进行实验,实验结果表明,这两种改进方法的效果明显,性能与同类系统相比有显著提升.  相似文献   

3.
个性化新闻推荐系统可以帮助用户在海量新闻中快速获取感兴趣内容。用户的兴趣有长期和短期之分,新闻信息也分多种类别,而现有的方法往往基于单类别信息学习新闻的表示。基于此,提出一种融合长短期用户表示、多特征新闻表示的方法。采用基于协同注意力机制的多视角学习方法构建新闻编码器,从新闻的标题、分类和摘要特征中学习统一的新闻表示;利用改进的新闻表示在基于长短期兴趣的用户编码器中进一步细粒度学习用户表示。在真实新闻数据集上的实验结果表明,该方法与其他推荐算法相比在准确率上有明显提高。  相似文献   

4.
随着网络中出现大量的新闻内容,如何在短期内为用户及时发现新闻热点话题越来越受到学者们的关注。提出一种基于BTM模型和改进K-Means聚类算法的中文新闻话题检测模型。对网易新闻语料库引入BTM模型,发现与主题相关的话题词,从而推断热点话题;针对K-Means算法初始值敏感等问题,将基于共轭梯度的人工鱼群算法引入传统的K-Means算法;利用改进K-Means聚类算法对得到的话题词进行聚类。实验结果表明,所提方法与传统方法相比可有效、准确提高话题的准确性。  相似文献   

5.
提出一种基于新闻时效性的协同过滤推荐算法. 首先对新闻的时效性进行了特征分析, 建立了新闻时效性模型, 然后结合新闻时效性改进了基于用户的协同过滤算法. 最后进行了仿真实验, 实验结果表明, 该方法可以有效提高推荐算法的性能, 改善新闻推荐准确度和召回率.  相似文献   

6.
针对农业新闻目前面临的针对性差、分类不清和数据集缺乏等问题,提出一种基于ERNIE(Enhanced Representation through kNowledge IntEgration)、深度金字塔卷积神经网络(DPCNN)和双向门控循环单元(BiGRU)的农业新闻分类模型——EGC。首先利用ERNIE对数据集进行编码,然后利用改进后的DPCNN和BiGRU同时提取新闻文本的特征,再将两者提取的特征进行拼合并经过Softmax得到最终结果。为了使EGC模型适用于农业新闻分类领域,对DPCNN进行改进,减少它的卷积层以保留更多特征。实验结果表明,与ERNIE相比,EGC模型的精确率、召回率和F1分数别提升了1.47、1.29和1.42个百分点,优于传统分类模型。  相似文献   

7.
互联网的高速发展,使用户很难在"信息海洋"中找到感兴趣的新闻,如何为用户准确推荐满足其需求的个性化新闻已成为当前研究的热点和难点。为了改善新闻推荐系统的准确性,将时间戳信息引入到新闻推荐模型中。首先,利用分词工具对新闻标题和新闻内容进行分词,并引进时间加权函数来计算用户对单个分词的偏好;预测用户偏好时不仅根据用户自身的偏好进行预测,还使用改进协同过滤方法来预测用户偏好;最后,通过融合得到的偏好值对新闻进行推荐。实验结果表明,该模型不仅能提高新闻推荐系统的准确性,还缩短了模型构建的响应时间。  相似文献   

8.
提出一种基于图模型的多文档摘要生成算法,对海外大量新闻文档进行主题划分,并提取每个主题的摘要。利用传统的基于图模型方法得到的摘要,其冗余度较高,亦不能够充分考虑新闻文本时效性强、主题明确的特征。在文本特征向量化方面,引入了热度系数,改进了传统的TF-IDF算法。在主题的划分方面,采用基于密度的两阶段聚类方法,改进了传统的基于[K]-Means进行聚类的方法的不足,同时对文本进行更明确、更具层次性的主题划分。在摘要抽取方面,为句子设计了符合新闻文本特征的重要度计算公式。实验结果表明,基于图模型的自动文本摘要生成算法的效果优于传统算法。  相似文献   

9.
《微型机与应用》2017,(19):19-22
传统的LDA主题模型没有考虑词频对主题分类的影响,使得主题分布向高频词倾斜。为了综合考虑词频和主题间的相关性,文中利用互信息能够表达变量间相关性的特点,在互信息基础上改进作为特征选择方法,利用评价函数评价特征词的权重值改进LDA算法分类过程,提高对主题分类贡献度高的特征词的作用。通过在新闻语料库上的分类实验证明了该方法的有效性,同时表明分类的准确率也有所提高。  相似文献   

10.
Hadoop云平台下的基于用户协同过滤算法研究   总被引:1,自引:0,他引:1  
随着互联网的高速发展,海量新闻的个性化推荐成为一个重要课题,针对海量新闻的个性化推荐算法进行研究,以MapReduce的并行方法设计了基于Hadoop云平台下的协同过滤算法,利用MapReduce的并行方法,将传统的协同过滤算法并行化,并详细说明了并行化步骤和实现细节;最后用实验结果验证了改进的并行化的协同过滤算法在运行速度和执行效率方面有明显的提高,更适合处理大数据.  相似文献   

11.
现有的大多数虚假新闻检测方法将视觉和文本特征串联拼接,导致模态信息冗余并且忽略了不同模态信息之间的相关性。为了解决上述问题,提出一种基于矩阵分解双线性池化的多模态融合虚假新闻检测算法。首先,该算法将多模态特征提取器捕捉的文本和视觉特征利用矩阵分解双线性池化方法进行有效融合,然后与虚假新闻检测器合作鉴别虚假新闻;此外,在训练阶段加入了事件分类器来预测事件标签并去除事件相关的依赖。在Twitter和微博两个多模态谣言数据集上进行了对比实验,证明了该算法的有效性。实验结果表明提出的模型能够有效地融合多模态数据,缩小模态间的异质性差异,从而提高虚假新闻检测的准确性。  相似文献   

12.
Twitter has become an important data source for detecting events, especially tracking detailed information for events of a specific domain. Previous studies on targeted-domain Twitter information extraction have used supervised learning techniques to identify domain-related tweets, however, the need for extensive manual labeling makes these supervised systems extremely expensive to build and maintain. What’s more, most of these existing work fail to consider spatiotemporal factors, which are essential attributes of target-domain events. In this paper, we propose a semi-supervised method for Automatical Targeted-domain Spatiotemporal Event Detection (ATSED) in Twitter. Given a targeted domain, ATSED first learns tweet labels from historical data, and then detects on-going events from real-time Twitter data streams. Specifically, an efficient label generation algorithm is proposed to automatically recognize tweet labels from domain-related news articles, a customized classifier is created for Twitter data analysis by utilizing tweets’ distinguishing features, and a novel multinomial spatial-scan model is provided to identify geographical locations for detected events. Experiments on 305 million tweets demonstrated the effectiveness of this new approach.  相似文献   

13.
针对传统新闻推荐的数据稀疏性和用户的兴趣爱好快速变化问题,提出了一种融合社交关系和标签信息的混合新闻推荐算法。首先,该算法充分利用社交网络中的社交关系和标签信息;然后使用概率主题模型(latent Dirichlet allocation,LDA)对用户兴趣进行建模;最后采用基于内容与协同过滤相结合的混合推荐算法来完成新闻推荐。实验结果表明,所提算法与已有的推荐算法相比较,在精确度上提升了10.7%、平均倒数排名上(mean reciprocal rank,MRR)提升了4.1%,在归一化折损累计增益(normalized discounted cumulative gain,NDCG)上提升了10%。该算法可在一定程度上提高新闻推荐算法的精度及推荐质量。  相似文献   

14.
为了获取同一事件的汉越双语新闻的自动摘要,该文提出了一种多特征融合的汉越双语新闻摘要方法。关于同一事件的新闻文本,其句子间具有一定的关联关系,利用这些关联关系有助于生成摘要。根据该思想,首先计算句子间的新闻要素共现程度及句子间的相似度;然后将这两种特征融入句子无向图,并利用图排序算法对句子进行排序;之后结合句子的位置特征对排序结果进行调序;最后挑选重要句子并去除冗余生成摘要。在汉越双语新闻文档集上进行了摘要实验,结果表明该方法取得了较好的结果,具有有效性。  相似文献   

15.
针对目前现有的新闻推荐系统未能充分考虑新闻的语义信息,对新闻文本建模因子的单一性问题,提出注意力与多视角融合的新闻推荐算法(Attention-BodyTitleEvent, Attention-BTE).利用BERT模型以及注意力机制分别对新闻标题、正文、事件向量化,将三者融合即新闻向量化表示,再对候选新闻和用户浏览新闻数据进行处理,分别得到对应的候选新闻向量化和用户向量化,并将其进行点乘得到用户点击候选新闻的概率,即新闻推荐结果.实验数据表明,与其他的新闻推荐算法相比,该模型在F1指标上提高了约6%.  相似文献   

16.
This paper studies a continuous-time stochastic linear-quadratic (SLQ) optimal control problem on infinite-horizon. Combining the Kronecker product theory with an existing policy iteration algorithm, a data-driven policy iteration algorithm is proposed to solve the problem. In contrast to most existing methods that need all information of system coefficients, the proposed algorithm eliminates the requirement of three system matrices by utilizing data of a stochastic system. More specifically, this algorithm uses the collected data to iteratively approximate the optimal control and a solution of the stochastic algebraic Riccati equation (SARE) corresponding to the SLQ optimal control problem. The convergence analysis of the obtained algorithm is given rigorously, and a simulation example is provided to illustrate the effectiveness and applicability of the algorithm.  相似文献   

17.
农业信息具有较强的时效性和周期性特征,传统基于行为的推荐算法能挖掘农户兴趣但不能反映农户不同时段的信息需求。同时,农户一般采用匿名网页直接浏览的方式查看农业新闻,显式反馈数据十分稀少,传统协同过滤推荐算法需要面临冷启动等问题。本文提出一种基于用户行为和新闻时效性的协同过滤推荐算法,综合采集用户的隐式、显式反馈数据等多维因素,同时考虑农业信息的分类特征及周期性特征,针对农户对不同农业信息分类信息的周期性关注度变化以及热度系数提高农业新闻推荐的针对性和时效性。通过对真实访问数据进行验证,结果表明提出的算法能有效提升农业信息推荐准确率。  相似文献   

18.
袁仁进  陈刚 《计算机科学》2018,45(Z11):462-467
为研究新闻事件发生地对新闻推荐系统性能的影响,提出了一种顾及事件地理位置的新闻推荐算法。首先,设计了提取新闻事件发生地的相关算法;其次,结合向量空间模型、TF-IDF算法和word2vec工具构建了新闻特征向量;接着,着重讨论了用户兴趣模型的构建问题;最后,运用余弦相似度方法计算用户兴趣模型与候选新闻集之间的相似性,从而完成推荐。实验结果表明,设计的新闻事件发生地抽取算法的性能较好,准确率达到93.6%,以此为基础构建的新闻推荐算法与协同过滤推荐算法相比仅考虑新闻内容的推荐算法在F值上有所提高。  相似文献   

19.
一种基于动态进化模型的事件探测和追踪算法   总被引:16,自引:2,他引:16  
在大量分析网络新闻特点的基础上,借鉴Single-Pass聚类思想,并结合新闻要素给出了一种基于动态进化模型的事件探测和追踪算法.该动态模型是基于新闻事件的生存特点提出的,包括:基于时间距离的相似度计算模型、事件模板进化策略以及动态阈值设置思想.该算法可以自动对新闻资料进行组织生成新闻专题,进而为用户提供个性化服务.实验结果验证了算法的有效性.  相似文献   

20.
基于词共现图的中文微博新闻话题识别   总被引:2,自引:0,他引:2  
针对传统的话题检测算法主要适用于新闻网页和博客等长文本信息,而不能有效处理具有稀疏性的微博数据,给出一种基于词共现图的方法来识别微博中的新闻话题.该方法首先在微博数据预处理之后,综合相对词频和词频增加率2个因素抽取微博数据中的主题词.然后根据主题词间的共现度构建词共现图,把词共现图中每个不连通的簇集看成一个新闻话题,并使用每个簇集中包含信息量较大的几个主题词来表示微博新闻话题.最后在微博数据集上进行实验,实现了对微博中新闻话题的识别,验证了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号