首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于领域本体的文本过滤模型   总被引:2,自引:0,他引:2  
目前广为应用的文本过滤技术是利用关键字检索,没有考虑概念之间的关联,因此其过滤性能在达到一定程度后,很难有突破.介绍了一种基于领域本体的文本过滤模型DOTFM,探讨了领域本体在文本过滤中的应用.DOTFM在文本向量的表示和用户模板建立中引入概念关联度,并提出局部型和全局型的文本向量和用户模板.实验结果表明,DOTFM的召回率比之传统的基于关键字的过滤模型有较大提高,而其准确率在合适的阀值时,也有较大提高.  相似文献   

2.
文本过滤是指从大量的文本中寻找满足用户需求的文本的过程。以互联网上下载的突发事件新闻文本为研究背景,提出了基于新闻标题的文本过滤模型,根据示例文本构建标题过滤模板,采用基于关键字的过滤方法对突发事件新闻文本进行过滤。其特点是实现简单,过滤速度快,有一定的实际作用。  相似文献   

3.
文本结构分析与基于示例的文本过滤   总被引:13,自引:0,他引:13  
本文简要介绍了文本过滤的背景和发展,提出了基于示例的中文文本过滤模型.其基本思想是首先对于用户提出的示例文本进行文本结构分析,采用本文提出的文本层次分析方法,提取文本特征,形成主题词表示的用户模版(user profile),然后进行了文本过滤,同时引进段落匹配机制,提高过滤效率.通过用户反馈,改进用户模版.  相似文献   

4.
基于概念的文本过滤模型   总被引:8,自引:0,他引:8  
当前,文本过滤技术基本上停留在关键词阶段,无法处理同义和概念之间的上下位关系,因此,准确率和召回率达到一定值后,无论如何改进算法也无法再取得突破进展。文章试图从语义的角度突破这个困境,对常识知识库HowNet在文本过滤中的应用,以及文本过滤中所涉及的关键技术,包括基于概念的文本表示方法、用户模板表示方法、文本过滤算法进行了研究和探讨。实验结果表明,基于概念的方法的确可以提高文本过滤的性能。  相似文献   

5.
王开选  张永奎 《计算机工程》2006,32(5):205-206,276
以报道互联网上突发事件的新闻为研究背景,以个性化服务中的关键技术之一用户模型的表示方祛为目标,运用面向对象的技术对用户模型的表示进行了尝试性探索。实验结果表明,这种探索有一定的实际作用。  相似文献   

6.
基于混合模式的文本过滤模型   总被引:16,自引:1,他引:15  
文本过滤旨在帮助用户处理自己感兴趣的文本,提出了基于混合模式的文本过滤模式,其基本思想是将基于内容的过滤方法和合作过滤方法结合起来,给出了用户评沪的权威性和一致性度是,以便更好地运用用户的评注信息,在此基础上,结合用户的个人兴趣,给出了文硒特征抽取机制、文本推荐机制、文本与信息需求模型的匹配机制,该方法不依赖于具体的领域知识库,大大降低“噪音”影响,并可以适用于多媒体类型文件的过滤和信息服务。  相似文献   

7.
基于概念扩充的中文文本过滤模型   总被引:8,自引:0,他引:8  
1 前言今天,以因特网为主体的信息高速公路仍在不断普及和发展,因特网上蕴涵的海量信息远远超过人们的想象,面对这样的信息汪洋大海,人们往往感到束手无策,无所适从,出现所谓的“信息过载”问题。如何帮助人们有效地选择和利用所感兴趣的信息,同时保证人们在信息选择方面的个人隐私权利?这已成为学术界和企业界所十分关注的焦点。因此,信息过滤技术应  相似文献   

8.
关庆珍  周竹荣 《计算机应用》2007,27(10):2504-2507
针对现有本体用户模型的难点与不足,提出了一种改进的基于领域本体的用户模型(OBUM),利用文本挖掘技术构建领域本体,通过本体学习来完成用户模型的学习和更新。  相似文献   

9.
为了解决传统文本过滤以联,提出了一种基于概念格的文本过滤模型.在以传统的向量空问模型对文本进行表示的基础上,将文本与文本特征之间的关系以概念格的形式加以表示.设计了基于领域本体的概念相似度的计算方法,以概念相似度对概念之间的关联进行衡量.利用了概念格中的层次关系,设计了一个基于概念格的匹配过滤算法.实验结果表明,该模型...  相似文献   

10.
基于合作模式的文本过滤模型   总被引:4,自引:0,他引:4  
文本过滤为因特网上用户提供信息服务,旨在帮助用户选择和处理自己感兴趣的文本。本文提出了基于合作模式的文本过滤模型。其基本思想是根据用户评注将用户分成若干类别,综合类别内外用户评注影响,给出了文本推荐机制,将相关文本推荐给用户。此外,利用相关反馈进行类别和参数重新调整,可以有效地改善过滤的效率。该方法不仅适用于单纯文本介质,而且还可以应用到其他非文本介质。  相似文献   

11.
信息过滤已成为当今信息技术研究的热点。主要介绍布尔模型、向量空间模型和概率模型,并分析它们各自的优点及存在的不足之处。在此基础上,提出一种新的信息过滤模型——基于本体论的信息过滤模型,阐述用户兴趣模板的构建步骤、用户相关反馈和更新算法,为基于本体的信息过滤技术提供了理论基础。  相似文献   

12.
基于本体的电力多数据源信息集成研究   总被引:1,自引:0,他引:1  
在电力领域,由于异构的多数据源带来的语义冲突问题越来越成为制约信息集成的难点。基于本体的概念,提出一个电力信息语义集成方案。从分布式的电力数据源中提取出局部本体,然后将局部本体整合为全局本体,从而消除数据库之间的信息冗余与冲突,能够实现多维查询、信息推理和本体演化等功能,从语义层面实现电力信息的无歧义共享与重用。  相似文献   

13.
针对传统个性化推荐系统用户兴趣模型创建和更新的不足,无法准确地感知用户特定背景下的语义信息和用户兴趣随着时间的变化,基于用户兴趣本体提出一种新用户兴趣模型,并通过激活扩展理论描述该用户兴趣模型的更新算法。同时,改进了推荐算法,结合协同过滤进行个性化推荐。实验结果表明,该模型能够有效反映用户兴趣,新的推荐算法在MEA、多样性、冷启动处理、稳定性方面都具备很高的性能。  相似文献   

14.
基于规则演算的不良信息文本过滤模型   总被引:2,自引:0,他引:2  
本文在定义元符号及演算规则的基础上,基于字符串匹配,给出了一个不良信息文本过滤模型。由于规则是通过元符号或其它规则演算生成,因而本模型具有较强的过滤能力。  相似文献   

15.
提出一种基于二元模型的分层过滤策略的中文文本过滤方法.首先,在非法文本集中使用文档频率和卡方统计相结合的方法抽取非法关键词集合,并根据制定的策略,筛选出非法文本和一些包含非法关键词的合法文本;其次,在筛选出的文本中,选取包含非法关键词的二元词串作为特征集合,以卡方统计方法对特征进行评估,选取预定数目作为结果的特征子集,使用支持向量机分类器过滤非法文本.实验表明提出的过滤方法的准确率、召唤率和F1的值分别为:95.65%,84.87%和89.93%.  相似文献   

16.
一个基于语义分析的倾向性文档过滤系统   总被引:3,自引:0,他引:3  
目前的过滤系统大都是基于关键词的,这类系统适用于主题性过滤,而对倾向性过滤效果不好。本文提出一种适用于倾向性文档过滤的系统,通过语义分析,有效地识别和过滤倾向性文本信息。  相似文献   

17.
如何准确地实现文本的有序组织,是自然语言处理的一个重要研究方向。本文首先介绍了文本分类的研究现状,讨论了基于向量空间模型的分类法的基本思想。在此基础上,通过对文本识别本质的研究,在向量空间模型的基础上,提出一种新的结合了信息相关性分析的文本分类模型ICFM(Information Correlation based Fast text categorization Model),并以实验验证了该模型的性能。  相似文献   

18.
基于语义分析的网络不良信息过滤系统研究   总被引:1,自引:0,他引:1  
设计一种基于语义分析的信息过滤模型。该模型针对不良信息的特点,以自然语句为处理单元,采用主题词和语义分析的两级过滤工作模式,可以同时获得较高的处理效率和精度。样本实验表明,该过滤模型能够更好地满足不良信息过滤的实时性和准确性要求。  相似文献   

19.
面对实时网络信息过滤的新挑战,自适应信息过滤能够解决问题。针对现有自适应系统的不足,提出了提高模板准确性的学习和过滤阈值优化的新方法。采用增量迭代学习算法来逼近真实的过滤模板,结合非法网页的分布函数自适应调整阈值,不断提高过滤精度,并运行于一个校园网关之上,取得了较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号