首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
一种基于关联规则的中文概念集生成算法   总被引:1,自引:0,他引:1  
本文提出了一种基于关联规则的中文概念集生成算法。该算法首先产生文档的中文关键词集,采用向量空间模型VSM(vector space model)表示文档;然后以中文关键词为事务项,以中文文档为事务,采用成熟的关联规则算法发现中文关键词频繁集;再生成原始概念集并对原始概念集进行聚类,最终实现了中文概念集的自生成,同时该算法能引入增量更新的特性,对概念集进行增量更新。通过实验,表明该算法能有效地生成中文概念集,可以用之于对表示中文文档的高维特征向量的语义降维,具有一定的使用价值。  相似文献   

2.
郭猛  冯志勇 《微处理机》2007,28(4):116-119
基于关键词处理的传统检索技术会在检索过程中遗漏大量与检索概念相关或同义的内容。针对这种情况,提出了一种基于本体的Web信息检索模型。另外该模型通过解析语义文档并分析所需的概念属性之间的关系得到一定的相似度,并在检索过程中利用该相似度进行语义扩展。  相似文献   

3.
基于领域本体的智能检索模型   总被引:1,自引:0,他引:1       下载免费PDF全文
在传统检索模型的基础上,结合本体概念,提出一种基于领域本体的检索模型。该模型利用本体中语义概念关系及语义扩展机制对查询关键词进行概念映射及扩展,通过计算文档相似度返回检索结果,提高检索的查准率和查全率。  相似文献   

4.
传统文档特征权重模型仅考虑关键词本身,文档内其他相关词汇并没有参与计算,信息检索时无法返回全面和准确的结果。为解决该问题提出了一种基于本体的林业领域文档特征权重模型。该模型计算TF-IDF特征权重;结合林业领域本体,分别获取关键词和林业领域内其他词汇的语义距离、语义重合度和概念的层次差,并计算语义相关度;结合TF-IDF和语义相似度的结果计算特征权重。实验证明该模型可以提高文本检索的查准率和查全率,使检索结果更加满足用户的需求。  相似文献   

5.
应用于用户兴趣建模的多文本关键词抽取研究   总被引:1,自引:0,他引:1  
寇苏玲  蔡庆生 《计算机仿真》2007,24(2):103-105,109
现有的关键词抽取算法大部分是基于单篇文档的,虽然能成功抽取出单个文章的关键词,却无法满足针对多文档的关联检索.以单文档关键词抽取为基础,引入多文本文摘中的质心概念和MMR公式并加以变形,提出并分析比较了两种多文档关键词抽取算法:对内容相近的多篇文章进行关键词抽取,并按照权重生成关键词向最,建立基于关键词向量空间的用户兴趣模型.通过对5个主题100篇文章的测试表明,使用这两种算法提取出的关键词的准确率和召回率均达到了85%左右,能够较为准确地表示用户的兴趣模型.  相似文献   

6.
在研究传统证据分析工具不足的基础上,结合模糊本体概念,提出一种基于模糊本体的证据分析方法。该方法利用模糊本体中的隶属度概念,对查询语句和文档关键词向量空间模型进行模糊本体概念映射及概念相似度计算。通过数值实验对该方法进行性能分析。实验证明了该方法的有效性。  相似文献   

7.
利用可变长语言模型对中文文档的关键词进行准确识别是中文信息处理中的一个重要问题。由于不存在n元语言模型的截断效应,对关键词检索的长度没有限制,因此增加了关键词识别的难度。利用PAT—tree技术设计了一个改进的可变长统计语言模型对中文文档中的关键词进行识别。在该模型基础上进行相关性检测实验。实验结果表明基于PAT—tree的改进语言模型能更好的识别关键词。  相似文献   

8.
当前的搜索引擎已不能很好的满足用户的需求,基于关键词的概念搜索引擎就是要对用户输入的关键词进行概念分析,建立概念关键词集合,然后再去搜索。搜索中我们要充分考虑关键词在文档中的位置,关键词在文档中的权重应与关键词在文档中的位置成函数关系。同时也要考虑个人的兴趣,根据个人的兴趣对搜索到的文档排序。  相似文献   

9.
基于本体的Web智能检索研究   总被引:1,自引:0,他引:1       下载免费PDF全文
尹焕亮  孙四明  张峰 《计算机工程》2009,35(23):44-46,4
针对传统的基于关键词信息检索方式存在的问题,提出一种基于领域本体的语义检索模型,在建立本体概念与文档内容关联关系的基础上,对用户的查询输入预处理,利用本体计算两者的相似程度,给出与查询请求相关的排序后的文档。通过搭建基于本体的Web智能检索原型系统,验证了该模型的有效性。  相似文献   

10.
摘 要: 为了从日益丰富的蒙古文信息中快速准确地检索用户需求的主题信息,提出了一种融合主题模型LDA与语言模型的方法。该方法首先对蒙古文文本建立一元和二元语言模型,得到文本的语言概率分布;然后基于LDA建立主题模型,利用吉普斯抽样方法计算模型的参数,挖掘得到文档隐含的主题概率分布;最后,计算出文档主题分布与语言分布的线性组合概率分布,以此分布来计算文档主题与查询关键词之间的相似度,返回与查询关键词主题最相关的文档。语言模型充分利用蒙古文语法特征,而主题模型LDA又具有良好的潜在语义挖掘及主题发现的泛化学习能力,从而结合两种方法更好的实现蒙古文文档的主题语义检索,提高检索准确性。实验结果表明,融合LDA模型与语言模型的方法相比单一模型体现主题语义方面取得了较好的效果。  相似文献   

11.
概念格是数据分析理论中的一种有力工具。针对查询课程系统这类问题,利用概念间的相似度构造加权的概念格.从而给出一种方法来解决查询过程中关键词的输入顺序问题,并结合实例说明了这种方法的有效性。  相似文献   

12.
本文分别从网页的使用功能和艺术设计两个方面着手,研究探讨两者的关系,对初级概念网页和概念网页的形成和发展进行论述。笔者认为概念网页是设计者对未来网页形式的探索,预测未来网页的结构和形式,向人们展示设计者新颖、独特、前卫的设计思想,概念网页是时代的最新研究成果,代表着未来网页的发展方向。  相似文献   

13.
概念格是数据分析理论中的一种有力工具。针对查询课程系统这类问题,利用概念间的相似度构造加权的概念格,从而给出一种方法来解决查询过程中关键词的输入顺序问题,并结合实例说明了这种方法的有效性。  相似文献   

14.
针对当前搜索引擎返回大量与用户请求无关结果的问题,提出一种新的生成相关搜索词的方法。该方法是基于开源搜索工具包Lucene的.通过对文档内容的切分和筛选找出概念词,再通过TF—IDF方法计算概念词的同现率,最后通过连续性Hopfield神经网络建立概念集,从而获得概念词的相关词推荐。  相似文献   

15.
针对当前搜索引擎返回大量与用户请求无关结果的问题,提出一种新的生成相关搜索词的方法。该方法是基于开源搜索工具包Lucene的,通过对文档内容的切分和筛选找出概念词,再通过TF-IDF方法计算概念词的同现率,最后通过连续性Hopfield神经网络建立概念集,从而获得概念词的相关词推荐。  相似文献   

16.
在面向属性归纳(AOG)的数据挖掘中,属性归约及概念归纳都离不开概念层次.而概念层次一般都是先验的,当出现概念层次中没有的新的概念时,无法进行归纳.以属性论为基础的概念相容测度,将概念层次单纯的文字表示转换为其定性基准的表示,给出了名称型属性的概念层次树的动态生成算法.当有新的属性值出现时,可以不用重新生成概念树,只需调用该算法,将新的属性值插入已有概念层次树即可.从而可以让概念归纳与修改概念层次同时进行,使AOG具有了动态归纳的特性.  相似文献   

17.
介绍了Ontology的基本概念及结构,提出了一个基于Ontology的汉语时间语义分析的基本模型,并介绍了Ontology在模型中的作用及其与词典相结合后,提取文本中的时间短语并进行分析的方法。  相似文献   

18.
西摩·切瓦斯特是美国著名的观念形象设计大师,他在探索创作时注重个人观念的表达,突破传统创作上表现出来的单一与刻板,用卡通漫画的视觉形象来表达作品深刻的内涵和寓意;切瓦斯特大量地运用线描和色彩平涂法并注重新媒介的使用,他的设计作品明显地受到其同时代的波普艺术和嬉皮文化的熏陶,洋溢着浪漫、幽默的氛围。  相似文献   

19.
智能交通信号控制机的研究   总被引:5,自引:0,他引:5  
基于现代城市交通控制的要求,本详细阐述了智能型交通信号控制机的结构与功能,并对各组成部分的工作原理及软件流程,进行了比较详细的分析。  相似文献   

20.
为了改善Folksonomy中的资源利用率,将形式概念分析与Folksonomy相结合,引入概念稳定性度量方法来更精确的表示Folksonomy概念结构.研究工作的重点是通过概念格来发现Folksonomy中的特殊社区团体——用户兴趣标签.实验中分别使用概念稳定性和支持度两种方法采缩减概念格的规模,并从美味书签网站del.icio.us上收集真实数据集进行实验对比,分析和讨论了利用稳定性提取概念的效率和意义.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号