首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
潜在语义索此方法在信息过滤中的应用   总被引:1,自引:0,他引:1  
信息过滤是一种WEB信息服务的新技术,旨在实现网络服务器向客户端主动的信息推送,其核心技术之一是用户兴趣主题模型的表示,文章利用潜在语义索引方法构建用户兴趣主题模型,并对网上大量的中文科技文献信息进行过滤,初步实验的结果表明,该方法与信传统的向量空间方法相比,效率有明显提高。  相似文献   

2.
基于Agent的个性化信息过滤系统的设计与实现   总被引:3,自引:0,他引:3  
针对用户个性化服务的特定需求,文中提出了一种基于Agent的个性化信息过滤系统的设计思想及其实现过程。采用基于主题的过滤和基于兴趣的过滤相结合的过滤方法对信息分两次过滤,同时利用Agent跟踪用户的浏览行为,从而提供隐式反馈。系统能够根据文本的内容自动判别文本所属主题分类,并计算待过滤信息与用户兴趣之间的相关度,最后利用用户的反馈对用户兴趣模型进行更新,从而帮助用户准确获取有用信息。  相似文献   

3.
针对用户个性化服务的特定需求,文中提出了一种基于Agent的个性化信息过滤系统的设计思想及其实现过程。采用基于主题的过滤和基于兴趣的过滤相结合的过滤方法对信息分两次过滤,同时利用Agent跟踪用户的浏览行为,从而提供隐式反馈。系统能够根据文本的内容自动判别文本所属主题分类,并计算待过滤信息与用户兴趣之间的相关度,最后利用用户的反馈对用户兴趣模型进行更新,从而帮助用户准确获取有用信息。  相似文献   

4.
用户兴趣建模是个性化服务的核心,考虑到情景信息对用户偏好的影响,对融和情景信息的用户行为日志数据进行深入研究,提出了一种基于情景信息的用户兴趣建模方法.该方法首先通过计算情景相似度来获得用户当前情景的近似情景集;对“用户-兴趣项-情景”三维模型采用情景预过滤的方法降维处理.然后根据用户浏览内容得到用户兴趣主题,分析页面内容得到每种主题的兴趣关键词,建立基于层次向量空间模型的用户兴趣模型.实验结果表明,本文提出的基于情景信息的用户兴趣模型对用户兴趣的预测误差控制在9%以内,是有效的.  相似文献   

5.
王建  黄佳进 《计算机科学》2017,44(2):267-269, 305
推荐系统是解决互联网信息过载问题的有效途径之一,其中具有代表性的是协同过滤推荐。传统的协同过滤推荐方法只考虑评分信息,而评论信息则包含了用户和物品更具体的特征信息。使用主题模型LDA并结合评分信息和评论信息,提出了一种基于用户改进的LDA算法。假设每个用户下隐含着主题分布,主题下隐含着物品分布,同时 词语的分布由主题和物品共同决定,该算法根据潜在主题分布挖掘用户兴趣进而完成推荐。实验结果表明,改进的算法有效提升了推荐质量。  相似文献   

6.
针对单一角度描述用户兴趣存在片面性的问题,该文提出一种融合用户主题兴趣和用户行为的文档推荐方法。一方面从主题兴趣的角度,构建反映用户主题兴趣的主题向量用户模型;另一方面从用户行为的角度,构建反映用户行为兴趣的打分矩阵用户模型。然后,基于上述用户模型提出了两种文档推荐方法,并采用线性加权的方式融合这两种方法,从而实现对用户主题兴趣与用户行为的融合。实验结果表明,该方法的推荐结果好于协同过滤推荐方法和基于内容的推荐方法。  相似文献   

7.
论文提出了一个关键词过滤和向量空间模型相结合的精细过滤模型,重点研究了如何根据用户的纠正信息构造修正型反馈集以及如何通过增量式反馈信息不断修正向量空间模型中的用户兴趣向量去逼近真实的用户兴趣的方法。  相似文献   

8.
传统的协同过滤算法虽然可以很容易地挖掘出用户的兴趣爱好,但存在数据冷启动和稀疏性问题.针对这些问题,提出一种基于用户兴趣模型的推荐算法.首先通过LDA主题模型训练数据集得到物品-主题概率分布矩阵,利用物品-主题概率分布矩阵得到用户历史兴趣模型,然后结合用户历史行为信息和物品内容信息得到用户兴趣模型,最后计算用户与候选集之间的相似度,进行TOP-N推荐.在豆瓣电影数据集上的实验结果表明,改进后的推荐算法能够更好地处理稀疏数据和冷启动问题,并且明显提高了推荐质量.  相似文献   

9.
陈剑  张冬梅  陈钊 《计算机工程与应用》2012,48(14):134-138,162
目前信息推送服务广泛应用于各类电子商务网站,然而传统信息过滤技术在林产品贸易信息过滤的过程中,存在着不足。在总结林产品贸易信息过滤的特点的基础上,提出梯级过滤技术。该技术根据林产品贸易用户兴趣的不同、用户需求程度的不同、林产品贸易信息特征项权重的不同,在提出林产品贸易信息特征向量空间模型和分析用户兴趣特征向量结构的基础上,采用先进行用户显性需求的严格过滤,再进行用户显性需求的模糊过滤,再进行用户隐性需求的过滤的梯级过滤方法,从而达到准确满足用户需求的目的。实验结果证明该方法能够有效地过滤出用户满意的信息。  相似文献   

10.
随着网络信息资源的迅速增加,如何及时准确地获取所需信息是现代网络信息过滤技术需要解决的主要问题.为了给用户提供更准确的信息,提出了一种基于用户反馈的智能合作过滤模型(Agent collaborative filtering model based on users'feedback,ACFM)和用户兴趣模型,该模型通过隐式反馈和显式反馈这两种用户兴趣反馈学习实现合作过滤.实验结果表明,ACFM在预测用户兴趣的效果和推荐搜索信息的准确率方面比传统的搜索引擎有明显改善.  相似文献   

11.
本文针对当前传统潜在语义索引(LSI——latent semantic indexing)技术在提供信息过滤服务时已经不能满足用户个性化需求这一实际情况,提出利用隐式反馈技术来解决如何提供给不同用户以不同信息结果这一问题。在传统的LSI技术上提出了一种基于隐式反馈的LSI个性化信息过滤方法,该方法通过引入隐式反馈技术,将其应用于信息过滤中,从而可以为不同用户提供更多更有针对性的信息结果。本文给出了该方法的公式和具体算法,为其应用的实现提供了理论基础。  相似文献   

12.
朱健  卢秉亮  张春宇 《微处理机》2012,33(2):32-34,38
通过对网络信息内容进行分析并对信息进行过滤,能够保证信息的安全性。在关键字过滤和IP过滤基础上,采用双向最大匹配和基于内容分析的K-最邻近文本分类算法相结合进行内容过滤,以达到信息系统过滤信息的质量和速度的效果。以准确率和查全率为标准,对本方案进行测定和评估,评估结果表明,本方案的过滤效果比较理想。  相似文献   

13.
Web主题检索是信息检索领域一个将采集技术与过滤方法结合的新兴方向,也是信息处理领域的研究热点。针对现有主题检索系统在Web页面文本的主题相关性判断和Spider搜索策略方面存在的问题,引入两个性能优化方案,即利用信息抽取技术,提出了一种基于模式集的主题相关性判断方法来提高主题判断准确度;针对pagerank在主题检索中存在的不足,引入基于增强学习的页面评估算法,提出了Web环境优先的搜索策略。最后根据实验结果评估两个算法的性能。  相似文献   

14.
基于LSI和SVM分类法的定题邮件过滤研究   总被引:1,自引:0,他引:1  
潜在语义索引(LSI)是一种有效的信息查询方法,同时也被成功地应用到了文本分类中。LSI能解决同义和多义的问题,通过降低原始文档-术语矩阵的噪声来凸现出词条和文档之间的语义关系。为了识别和过滤有害的、不期望的定题的信息或Email,在双语言环境下(包括中文和英文),提出了一个基于改进的LSI方法的定题邮件类信息过滤系统,该系统采用潜在语义模型来表示被过滤的信息类,通过奇异值分解和正例监护学习方法,选择支持向量机(SVM)来识别和分类预定义的定题信息。实验结果表明:基于LSI的特征选择的SVM分类算法是一种更有效的信息识别和文本分类方法,不但具有较好的分类性能,同时也能大大减小计算的复杂性。  相似文献   

15.
网页信息的更新是网络一个非常重要的性质。同网络的其他应用类似,随着WWW信息内容更新的不断加快,如何有效地跟踪特定网站和页面的更新情况日渐成为人们关心的课题。论文讨论一个自适应的网页信息跟踪系统ChangeSpider,研究其体系结构、关键技术等方面的内容。实验表明ChangeSpider能够有效地跟踪网页的信息变化,及时地将变化的内容提交给用户。  相似文献   

16.
专题学习网站是目前网络教育研究的热点之一,但大多数专题学习网站是一种完全“学生驱动”的学习资源库式的系统,用户很难把握好自己的学习方向和过程,难以保证学习的质量。本文设计的思维导图式导学系统,结合了专题学习网站的教学设计、超文本(超媒体)、思维导图等领域的理论和技术。系统根据用户向系统提交的交互信息建立起用户所需的思维导图型导航链接,从而有效引导用户的学习方向。  相似文献   

17.
随着CSS+DIV布局方式逐渐成为网页结构布局的主流,对此类网页进行高效的主题信息抽取已成为专业搜索引擎的迫切任务之一。提出一种基于DIV标签树的网页主题信息抽取方法,首先根据DIV标签把HTML文档解析成DIV森林,然后过滤掉DIV标签树中的噪声结点并且建立STU-DIV模型树,最后通过主题相关度分析和剪枝算法,剪掉与主题信息无关的DIV标签树。通过对多个新闻网站的网页进行分析处理,实验证明此方法能够有效地抽取新闻网页的主题信息。  相似文献   

18.
随着CSS+DIV布局方式逐渐成为网页结构布局的主流,对此类网页进行高效的主题信息抽取已成为专业搜索引擎的迫切任务之一。提出一种基于DIV标签树的网页主题信息抽取方法,首先根据DIV标签把HTML文档解析成DIV森林,然后过滤掉DIV标签树中的噪声结点并且建立STU-DIV模型树,最后通过主题相关度分析和剪枝算法,剪掉与主题信息无关的DIV标签树。通过对多个新闻网站的网页进行分析处理,实验证明此方法能够有效地抽取新闻网页的主题信息。  相似文献   

19.
二次信息过滤是根据搜索引擎返回的网页,对过滤结果进行理解、分析并进一步过滤,以使结果优化。二次过滤中的样本分类处理中,通过对基于Bayesian算法的网页识别技术的研究,探讨了基于改进的Bayesian算法的网页识别技术,用于对二次过滤中的整篇文档进行进一步的分析以提高过滤效果。  相似文献   

20.
基于移动Agent的Web信息智能过滤算法及其实现*   总被引:3,自引:0,他引:3  
讨论了Web信息过滤的现状,提出了Web信息过滤应用中移动Agent的结构并设计了基于移动Agent的信息过滤工作模型。该模型由数据挖掘模块、信息过滤模块和相应的数据库模块组成,能够有效地屏蔽非法信息。实际应用表明,该Web信息过滤模型能够有效地完成对网页信息的过滤和保证内部人员合法地使用网络。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号