首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 0 毫秒

1.  应用于用户兴趣建模的多文本关键词抽取研究  被引次数:1
   寇苏玲  蔡庆生《计算机仿真》,2007年第24卷第2期
   现有的关键词抽取算法大部分是基于单篇文档的,虽然能成功抽取出单个文章的关键词,却无法满足针对多文档的关联检索.以单文档关键词抽取为基础,引入多文本文摘中的质心概念和MMR公式并加以变形,提出并分析比较了两种多文档关键词抽取算法:对内容相近的多篇文章进行关键词抽取,并按照权重生成关键词向最,建立基于关键词向量空间的用户兴趣模型.通过对5个主题100篇文章的测试表明,使用这两种算法提取出的关键词的准确率和召回率均达到了85%左右,能够较为准确地表示用户的兴趣模型.    

2.  基于组合词和同义词集的关键词提取算法*  
   蒋昌金  彭宏  陈建超  马千里  严桂夺《计算机应用研究》,2010年第27卷第8期
   为了提高关键词的提取准确率,在对现有关键词抽取方法进行研究的基础之上,针对影响关键词提取准确率的分词技术、同义词现象等难点,提出了一种基于组合词和同义词集的关键词提取算法。该算法首先利用组合词识别算法极大地改进分词效果,能识别网页上绝大多数的新词、未登录词,为提高关键词自动抽取准确率奠定了坚实的基础;同时利用构造的同义词集,合并同义词的词频,避免了同义词在输出结果中同现;利用综合评分公式,充分考虑候选关键词的位置、长度、词性等特性。实验数据表明,该方法有较高的提取准确率。    

3.  基于综合权重的多文档关键词抽取算法  
   胡志敏《计算机与数字工程》,2010年第38卷第6期
   多文档关键词抽取是进行在多篇文献中找出最能反映整体主题的关键词。对几种关键词抽取算法进行了介绍,分析了各自的优缺点,在TF/PDF算法的基础上,采用文献内和文献间综合权重的方法,提出了一种基于综合权重的多    

4.  一种关键词抽取方法研究  
   卞真旭《安徽电气工程职业技术学院学报》,2011年第16卷第Z1期
   本文提出一种基于词频统计的关键词抽取方法。利用了TextTiling方法、遗传算法和"成对比较法"进行了算法优化。    

5.  基于多特征的中文关键词抽取方法  
   杨颖  戴彬《计算机应用与软件》,2014年第11期
   关键词抽取是信息检索、文本分类、文本聚类以及自动文摘生成等技术的基础。在分析传统中文关键词抽取方法不足的基础上,提出一种基于多特征的中文关键词提取方法。该方法在抽取中文关键词过程中,从词频、关联度、词性以及位置等多种特征来全面考查关键词,有效地避免了传统关键词提取方法产生的偏差。实验结果表明,与传统方法相比,该方法在不同测试集上关键词提取的平均召回率均得到明显提升。    

6.  基于主题特征的关键词抽取  被引次数:1
       邹东升  邢欣来  李英豪《计算机应用研究》,2012年第29卷第11期
   为了使抽取出的关键词更能反映文档主题,提出了一种新的词的主题特征(topic feature,TF)计算方法,该方法利用主题模型中词和主题的分布情况计算词的主题特征。并将该特征与关键词抽取中的常用特征结合,用装袋决策树方法构造一个关键词抽取模型。实验结果表明提出的主题特征可以提升关键词抽取的效果,同时验证了装袋决策树在关键词抽取中的适用性。    

7.  基于多知识源融合的关键词重要性评价研究  
   刘远超  吴冲  王晓龙《哈尔滨工业大学学报》,2007年第39卷第7期
   词的重要性评价是关键词抽取研究中比较重要的环节,其中一种比较常用的方法是对词的相关属性进行加权分析,并根据综合权值确定重要性程度.词所处的位置、词频、词性以及与线索词的同现信息等都是影响关键词抽取的重要因素.本文首先对可能影响关键词抽取的因素进行了探讨和分析,而后利用遗传算法对各个知识源参数进行了优化.在人工标注的语料上进行的测试结果验证了该方法的可行性.    

8.  关键词自动标引方法综述  
   高燕《电子世界》,2012年第6期
   本文对关键词提取方法的研究进行了总结。对关键词自动标引方法进行分类梳理,将关键词自动标引方法分为统计分析方法、语言分析方法和人工智能方法三大类;主要介绍了近年比较常用的几种关键词自动标引方法,总结当前关键词自动标引方法存在的问题。    

9.  基于重复模式的论坛信息抽取研究  
   韩普  王泽《南京师范大学学报》,2010年第10卷第3期
   针对现有网络论坛信息抽取的不足,提出了一种基于重复模式发现算法的论坛信息抽取方法.该方法首先利用SgmlReader解析器将HTML文档转换为格式规范的XHTML文档,然后通过计算XHTML文档结构中DOM子树相似度,自动发现论坛页面结构的重复模式.该方法通过自动定位重复模式进行论坛信息抽取,较好地解决了在论坛信息抽取过程中需要人工查找、定位重复模式或者通过人工分析论坛页面代码定制抽取规则的问题.试验结果表明,该方法具有较好的准确性、通用性和实用性.    

10.  基于页面分类的Web信息抽取方法研究  
   成卫青  于静  杨晶  杨龙《微机发展》,2013年第1期
   通过对现有Web信息抽取方法和当前Web网页特点的分析,发现现有抽取技术存在抽取页面类型固定和抽取结果不准确的问题,为了弥补以上两个不足,文中提出了一种基于页面分类的Web信息抽取方法,此方法能够完成对互联网上主流信息的提取。通过对页面进行分类和对页面主体的提取,分别克服传统方法抽取页面类型固定和抽取结果不够准确的问题。文中设计了一个完整的Web信息抽取模型,并给出了各功能模块的实现方法。该模型包含页面主体提取、页面分类和信息抽取等模块,并利用正则表达式自动生成抽取规则,提高了抽取方法的通用性和准确性。最后用实验证实了文中方法的有效性与正确性。    

11.  基于小世界模型的复合关键词提取方法研究  
   马力  焦李成  白琳  周雅夫  董洛兵《中文信息学报》,2009年第23卷第3期
   该文提出了一种新的基于小世界网络特性的关键词提取算法.首先,利用K最邻近耦合图构成方式,将文档表示成为词语网络.引入词语聚类系数变化量和平均最短路径变化量来度量词语的重要性,选择重要性大的词语组成候选关键词集.利用侯选关键词集词语位置关系和汉语词性搭配关系,提取出复合关键词. 实验结果表明该方法是可行和有效的,获取复合关键词比一般关键词所表达的含义更便于人们对文本的理解.    

12.  基于TF统计和语法分析的关键词提取算法  
   《计算机应用与软件》,2014年第1期
   为了提高中文关键词提取的准确率和实用性,提出一种基于TF统计和语法分析相结合的中文关键词提取算法。该算法在对文本进行自动分词后,用TF统计和语法分析对每个词进行权重计算,然后根据计算结果提取文献的关键词。实验结果表明,该方法提高了关键词提取的精度。    

13.  基于DOM树的可适应性Web信息抽取  被引次数:5
   李朝  彭宏  叶苏南  张欢  杨亲遥《计算机科学》,2009年第36卷第7期
   Web信息抽取通常采用的是一种归纳学习方法,从给定的训练样本网页中学习到抽取规则,这种方法虽然能够准确地抽取出信息,但是当网站的模版发生改变后,必须重新获得抽取规则,因而这种抽取器的维护成本比较高,可适应性差.提出一种新的可适应性Web信息抽取方法,该方法首先通过聚类方法获取商品在网页中频繁出现的关键词组,然后利用网页的DOM树结构来确定包含这些关键词的信息块,从而实现Web信息的自动抽取.对大量商业网站进行信息抽取的实验表明,该算法不仅能有效抽取出商品信息,而且是一种与站点结构无关的可适应性信息抽取方法.    

14.  基于词共现矩阵的项目关键词词库和关键词语义网络  
   王庆  陈泽亚  郭静  陈晰  王晶华《计算机应用》,2015年第35卷第6期
   针对专业领域中科技项目的关键词提取和项目词库建立的问题,提出了一种基于语义关系、利用共现矩阵建立项目关键词词库的方法.该方法在传统的基于共现矩阵提取关键词研究的基础上,综合考虑了关键词在文章中的位置、词性以及逆向文件频率(IDF)等因素,对传统算法进行改进.另外,给出一种利用共现矩阵建立关键词关联网络,并通过计算与语义基向量相似度识别热点关键词的方法.使用882篇电力项目数据进行仿真实验,实验结果表明改进后的方法能够有效对科技项目进行关键词提取,建立关键词关联网络,并在准确率、召回率以及平衡F分数(F1-score)等指标上明显优于基于多特征融合的中文文本关键词提取方法.    

15.  基于科技文献的概念图自动构建方法  
   秦小铁《重庆科技学院学报(社会科学版)》,2012年第7期
   在数字化科研资源环境中,通过计算机技术自动生成某研究领域的概念图,可以大大缩短用户查找和分析信息的时间。介绍了一种自动构建概念图的方法。通过提取科技文献的关键词,分析关键词共频现象,结合寻径网络映射技术来构建概念图。    

16.  基于分离模型的中文关键词提取算法研究  被引次数:4
   罗准辰  王挺《中文信息学报》,2009年第23卷第1期
   关键词提取在自动文摘、信息检索、文本分类、文本聚类等方面具有十分重要的作用.通常所说的关键词实际上有相当一部分是关键的短语和未登录词,而这部分关键词的抽取是十分困难的问题.该文提出将关键词提取分为两个问题进行处理: 关键单词提取和关键词串提取,设计了一种基于分离模型的中文关键词提取算法.该算法并针对关键单词提取和关键词串提取这两个问题设计了不同的特征以提高抽取的准确性.实验表明,相对于传统的关键词提取算法,基于分离模型的中文关键词提取算法效果更好.    

17.  基于关键词语义与作用域扩展的事件检测  
   《计算机工程》,2014年第8期
   针对具有关联要素的中文文本事件检测问题,提出一种新的事件检测算法。采用关联关系分析、关键词语义扩展和关键词作用域扩展等方法,将目标事件包含的所有文本作为一个整体进行关键词匹配。该算法将关键词向量分为2个子向量,依次利用关键词子向量对待检测文本进行关键词语义扩展、关键词匹配和关联关系分析,形成目标事件的文本集并提取事件信息。实验结果显示,在关键词较少的条件下,该算法通过关键词语义扩展提高检测到目标事件的概率,在关键词较多时,通过关键词作用域扩展提高检测到目标事件的概率,可降低漏检率。    

18.  基于地理区域分布的人脸几何特征研究  被引次数:2
   张红梅  龚卫国  刘嘉敏  李伟红  梁毅雄《计算机应用》,2004年第24卷第2期
   文中提出了利用人脸面部几何特征地理区域分布的差异性进行人脸识别的新方法。首先针对比较典型的中国华北和西南两大区域采集100幅人脸面部图像,然后采用一种自动提取算法抽取面部几何特征,再利用感知器算法对这两大区域进行面部特征分类。实验结果表明该方法是可行而有效的。    

19.  压缩视频流关键帧快速抽取方法  
   李永刚  魏远旺  叶利华  朱蓉《计算机工程与应用》,2011年第47卷第33期
   关键帧获取是视频内容分析的前提。目前的视频关键帧提取算法往往需要经过较多的计算才能确定,不适合海量视频数据处理的需求。面对互联网数据流的监控应用,分析了MPEG压缩视频流的特点,提出了一种新的关键帧快速抽取方法。该方法考虑了所抽取关键帧的覆盖面和视频动态性检测的需要,根据视频长度抽取多段关键帧,段首帧反馈定位,段内按稀疏系数抽取。通过视频库和IDC机房网络数据流的检测实验表明,提出的方法是快速有效的,能较好地应用于高速网络的视频监控中。    

20.  一种新的基于结构的神经网络规则抽取方法  
   赵林  杨保安  谢志鸣《计算机应用与软件》,2007年第24卷第6期
   针对已有规则抽取方法的不足,提出一种新的基于结构的神经网络规则抽取方法(SRE).SRE在保证网络精度的情况下,自动确定最优的剪枝参数,而且抽取出的规则更为简练.最后以银行贷款风险预警为例,分别采用SRE和RX两种方法进行规则抽取,并对结果进行比较分析,结果表明,SRE抽取出的规则不仅简单,而且效果更好.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号