期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

许满英张永奎《电脑开发与应用》2010,23(4):1-2,14

文本过滤是指从大量的文本中寻找满足用户需求的文本的过程。以互联网上下载的突发事件新闻文本为研究背景,提出了基于新闻标题的文本过滤模型,根据示例文本构建标题过滤模板,采用基于关键字的过滤方法对突发事件新闻文本进行过滤。其特点是实现简单,过滤速度快,有一定的实际作用。相似文献

2.

基于合作模式的文本过滤模型 总被引：4，自引：0，他引：4

林鸿飞王剑峰《小型微型计算机系统》2001,22(11):1372-1374

文本过滤为因特网上用户提供信息服务,旨在帮助用户选择和处理自己感兴趣的文本。本文提出了基于合作模式的文本过滤模型。其基本思想是根据用户评注将用户分成若干类别,综合类别内外用户评注影响,给出了文本推荐机制,将相关文本推荐给用户。此外,利用相关反馈进行类别和参数重新调整,可以有效地改善过滤的效率。该方法不仅适用于单纯文本介质,而且还可以应用到其他非文本介质。相似文献

3.

基于混合模式的文本过滤模型 总被引：16，自引：1，他引：15

林鸿飞《计算机研究与发展》2001,38(9):1127-1131

文本过滤旨在帮助用户处理自己感兴趣的文本,提出了基于混合模式的文本过滤模式,其基本思想是将基于内容的过滤方法和合作过滤方法结合起来,给出了用户评沪的权威性和一致性度是,以便更好地运用用户的评注信息,在此基础上,结合用户的个人兴趣,给出了文硒特征抽取机制、文本推荐机制、文本与信息需求模型的匹配机制,该方法不依赖于具体的领域知识库,大大降低“噪音”影响,并可以适用于多媒体类型文件的过滤和信息服务。相似文献

4.

基于用户本体模型的文本信息过滤方法研究

刘中原张博锋潘建国王洋《计算机应用与软件》2009,26(5)

随着互联网信息的快速剧增,文本过滤技术成为互联网内容处理的关键技术,对海量信息处理具有很重要的意义.目前研究热点是基于语义的过滤方法,但是这些方法一般都需要大量规则和领域知识的支持,可用性不是很好.为了使机器更好地理解用户需求和文本内容,使过滤结果更能反映用户的真正需求,提高文本过滤的准确率和召回率,提出了基于用户本体模型UOM的文本信息过滤方法.该方法主要包括UOM构建、文本结构分析、文本概念提取和语义相关度计算等.基于UOM(User Ontology Model)的过滤方法,不仅可以表示复杂的用户需求,而且还避免了领域本体的构建,因而其有效性和实用性得到了很大的提高.通过在网络教学资源的智能按需服务系统中的实际运用,表明此方法能更有效地为用户提供过滤服务. 相似文献

5.

文本特征区域与文本过滤的匹配机制 总被引：3，自引：0，他引：3

林鸿飞战学刚姚天顺《计算机工程与应用》2000,36(7):7-9

为了根据用户的信息需求,在因特网上搜索相关文本,该文提出了一种文本过滤的匹配机制,其基本思想是：利用基于词典的概念扩张方法,改进用户模板。计算扩张的用户模板与文本的全局相似度,获取初步的过滤结果;在文本特征区域,进行标题、摘要段、首段和尾段等片断的局部相似度计算,以综合评价文本与用户模板的匹配情况。该方法可操作性强,效果明显。相似文献

6.

中文文本过滤的信息分流机制 总被引：17，自引：2，他引：15

林鸿飞李业丽姚天顺《计算机研究与发展》2000,37(4):470-476

在文本过滤中信息分流是提高过滤效率的有力的手段,为此,提出了一种新的中文文本过滤的信息分流机制．其基本思路是在概念扩充基础上,将不同用户的信息需求组织为树状结构,使其共同的部分成为共享分支,依据提出的侧面相似度和侧面匹配率来实现文本与模板的定量匹配,减弱传统的布尔模型对文本与模板匹配的严格限制,也弥补向量空间模型单纯数量化的不足,更加全面地反映用户的信息需求,试验表明该机制能够明显地提高过滤效率。相似文献

7.

基于领域本体的文本过滤模型 总被引：2，自引：0，他引：2

李嘉俊郑宇吴耿锋《计算机工程与设计》2008,29(21)

目前广为应用的文本过滤技术是利用关键字检索,没有考虑概念之间的关联,因此其过滤性能在达到一定程度后,很难有突破.介绍了一种基于领域本体的文本过滤模型DOTFM,探讨了领域本体在文本过滤中的应用.DOTFM在文本向量的表示和用户模板建立中引入概念关联度,并提出局部型和全局型的文本向量和用户模板.实验结果表明,DOTFM的召回率比之传统的基于关键字的过滤模型有较大提高,而其准确率在合适的阀值时,也有较大提高. 相似文献

8.

基于概念的文本过滤模型 总被引：8，自引：0，他引：8

赵丰年刘林商建云《计算机工程与应用》2006,42(4):186-188

当前,文本过滤技术基本上停留在关键词阶段,无法处理同义和概念之间的上下位关系,因此,准确率和召回率达到一定值后,无论如何改进算法也无法再取得突破进展。文章试图从语义的角度突破这个困境,对常识知识库HowNet在文本过滤中的应用,以及文本过滤中所涉及的关键技术,包括基于概念的文本表示方法、用户模板表示方法、文本过滤算法进行了研究和探讨。实验结果表明,基于概念的方法的确可以提高文本过滤的性能。相似文献

9.

基于文本过滤的数字图书馆个性化服务技术 总被引：3，自引：0，他引：3

张帆杨炳儒《计算机工程与应用》2006,42(31):206-208

在数字图书馆的应用中,个性化服务可以为用户提供符合其兴趣的检索结果。提供了一种针对数字图书馆个性化服务策略的文本过滤技术,通过在向量空间内建立用户兴趣模型和文本内容特征模型,计算它们的相似度后,将用户不感兴趣的文本过滤掉。详细描述了具体的建模过程和个性化文本过滤算法,最后给出了在实际的数字图书馆工程中的验证结果。相似文献

10.

基于语义空间的支持向量机的文本过滤 总被引：2，自引：0，他引：2

沈丽虹周昌乐《计算机应用》2005,25(3):664-665

传统的基于支持向量机的文本过滤,用向量空间模型来表示文本和用户模板,向量空间模型假设特征项之间是线性无关的,该假设引入了许多因具体用词变化不定而带来的词汇噪音信息,影响了基于支持向量机的文本过滤的过滤性能。提出基于语义空间的支持向量机的文本过滤,用语义来表示文本和用户模板。该方法主要通过奇异值分解提取文本的潜在语义空间,在语义空间上训练支持向量机得到用户模板和过滤阈值,文本流上的文本映射到语义空间上,在语义空间上计算用户模板和新文本的相似度。实验表明:该方法的过滤性能可以达到 98. 67%。相似文献

11.

基于概念的中文文本可视化表示机制 总被引：1，自引：0，他引：1

林鸿飞姚天顺《小型微型计算机系统》2000,21(10):1042-1045

为了浏览因特网上日益增多的在线中文文本,本文给出了基于概念的中文文本可视化表示机制,以直观的方式组织和表示文本及文本集,其基本思想是：首先在概念扩充的基础上,进行文本分类,然后,利用本文提出的提出的文本特征抽取方法和摘要方法,获取广西类别、广西、广西正文的标记的信息,通过类别,文本、有选择地浏览文本。相似文献

12.

中英文双语交叉过滤的逻辑模型 总被引：7，自引：1，他引：6

林鸿飞李业丽姚天顺《计算机工程与应用》2000,36(8):48-50

文章简要地描述了文本过滤的背景,提出了基于潜在语义索引的中英文双语交叉过滤的逻辑模型。其基本思想是改进双语交叉过滤中基于词汇对译的方法,而是利用双语文本中潜在的语义结构,作为用户模板与文本匹配的基础。将出现的双语词汇和文本映射为语义空间的向量,不必翻译对译词,甚至不需要出现相应的对译词,也能匹配成功,极大地改善了交叉过滤的精度,效果良好。相似文献

13.

基于潜在语义索引的文本分析方法 总被引：1，自引：0，他引：1

林鸿飞战学刚姚天顺《模式识别与人工智能》2000,13(1)

本文分析是文本处理领域中的重要内容,它可以有效地改进文本检索、文本过滤以及文本摘要的精度.本文简要描述了文本的物理结构和逻辑结构以及文本分析的背景,将潜在语义索引引入文本分析中,提出了基于潜在语义索引的层次分析方法.该方法保证了层次划分的有序性和聚合性,可操作性强,便于解释,并给出了在文本检索、文本过滤和文本摘要中的应用. 相似文献

14.

一个基于语义分析的倾向性文档过滤系统 总被引：3，自引：0，他引：3

江宝林刘永丹金峰葛家翔胡运发《计算机应用与软件》2005,22(1):10-11,139

目前的过滤系统大都是基于关键词的，这类系统适用于主题性过滤，而对倾向性过滤效果不好。本文提出一种适用于倾向性文档过滤的系统，通过语义分析，有效地识别和过滤倾向性文本信息。相似文献

15.

基于概念扩充的中文文本过滤模型 总被引：8，自引：0，他引：8

林鸿飞战学刚《计算机科学》2000,27(2):88-90

1 前言今天,以因特网为主体的信息高速公路仍在不断普及和发展,因特网上蕴涵的海量信息远远超过人们的想象,面对这样的信息汪洋大海,人们往往感到束手无策,无所适从,出现所谓的“信息过载”问题。如何帮助人们有效地选择和利用所感兴趣的信息,同时保证人们在信息选择方面的个人隐私权利?这已成为学术界和企业界所十分关注的焦点。因此,信息过滤技术应相似文献