首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
主题检测近年来在文本挖掘和自然语言处理领域得到了广泛的应用,对主题进行结构建模是主题检测的基础。为了对文本流中的多粒度主题进行建模,提出一种基于语义层次树的主题结构模型。该模型利用领域本体的特点,将主题同本体作一一映射,结合概率理论,将概念集里的概念用主题树的叶子节点表示,每一层中的节点均是下一层节点的多项分布,使之更适合描述文本流中多粒度的主题结构。为了便于构建主题的空间结构,提出主题的相似度和事件相关度计算方法。该文结尾设计了实验构造真实新闻文本流数据上的主题树。实验结果表明,该结构模型能够体现主题丰富的多粒度空间语义特征。  相似文献   

2.
为提高网页内容与特定主题之间相关度计算的准确度,提出一种基于领域本体的网页主题相关度计算模型OBWTCCM(ontology based webpage-topic correlation calculation model)。使用领域本体刻画主题,通过计算本体概念间的语义关系提取主题概念并构造主题语义矩阵,将特征词的统计信息与该矩阵相结合计算网页与主题之间的相关度。该模型改进了向量空间模型在相关度计算时对特征词语义层次分析的不足。实际项目应用结果表明,使用该方法计算得到的网页主题相关度与领域专家的判断总体相符,具有较理想的准确度。  相似文献   

3.
提出一种新的基于概念树的主题网络爬行方法。与传统基于关键词描述主题的方法不同,本文提出基于叙词表来构建一种称为概念树的表示方法来描述主题的概念。在此基础上,本文给出锚文本和HTML页面内容与主题相关度的计算方法。在分析URL的相关度时,首先判断其锚文本的相关度是否达到一定的阈值σ,只有当锚文本的相关度达不到σ时才会去下载URL对应的页面进行分析,否则将锚文本的相关度作为URL的相关度。这样的URL相关度计算方法可以大大减少不必要的计算开销,又可以充分地利用锚文本的信息。为了比较准确合理地获得阈值σ的取值,本文采用了最小均方差(LMS)的方法。  相似文献   

4.
基于语义的主题爬行策略   总被引:1,自引:0,他引:1  
叶育鑫  欧阳丹彤 《软件学报》2011,22(9):2075-2088
为使主题爬行能够充分利用资源的语义信息,提出基于语义的主题爬行策略.该策略利用领域本体刻画爬行主题,将本体语义映射到关键词表.通过定义断言集一致性扩展和域值关联推理任务,推演关键词间语义关系.在定义网页主题概念的基础上,结合本体推理方案提出主题概念的语义叠加效应模型.最后,利用主题概念的语义包含关系判定URLs抓取顺序.实验结果表明,该语义主题爬行策略在抓取收获率和爬行效率上优于现有同类方法,该方案有效、可行.  相似文献   

5.
针对传统主题爬虫方法容易陷入局部最优和主题描述不足的问题,提出一种融合本体和改进禁忌搜索策略(On-ITS)的主题爬虫方法。首先利用本体语义相似度计算主题语义向量,基于超级文本标记语言(HTML)网页文本特征位置加权构建网页文本特征向量,然后采用向量空间模型计算网页的主题相关度。在此基础上,计算锚文本主题相关度以及链接指向网页的PR值,综合分析链接优先度。另外,为了避免爬虫陷入局部最优,设计了基于ITS的主题爬虫,优化爬行队列。以暴雨灾害和台风灾害为主题,在相同的实验环境下,基于On-ITS的主题爬虫方法比对比算法的爬准率最多高58%,最少高8%,其他评价指标也很好。基于On-ITS的主题爬虫方法能有效提高获取领域信息的准确性,抓取更多与主题相关的网页。  相似文献   

6.
基于本体的智能检索及其在泌尿外科中的应用   总被引:1,自引:0,他引:1  
以本体论作为指导理论,通过研究泌尿外科辅助诊断系统模型,在泌尿外科领域本体的基础上研究语义相似度、语义相关度的计算方法,并提出新的相关度计算方法。该方法可以定量地分析领域本体中的概念间相关度。并通过建立泌尿外科本体,实现基于泌尿外科本体的语义推理。  相似文献   

7.
针对传统通用网络爬虫的自身固有的缺陷,结合本体的相关理论,提出了一种基于语义本体的网络爬虫的相关模型。该模型以本体构建领域知识概念集,结合知网,从语义的角度,利用扩展的元数据,在词的语义层次,对抓取的页面链接进行语义相关性计算,预测与主题相关的URL,提高采集的网络资源信息与设定主题的相关度。实验结果表明,该模型同其它通用网络爬虫模型相比具有较高的信息抓取准确率。  相似文献   

8.
基于关键词语义扩展的检索策略   总被引:3,自引:0,他引:3  
杜金洋  易禾  杨春 《计算机应用》2009,29(6):1575-1577
传统基于关键字匹配检索策略由于关键字的机械字符匹配和一词多义问题很容易造成漏检和错检。为此,从领域本体概念入手,结合关键字检索的特点,提出一种基于关键词语义扩展的检索策略。策略使用领域本体描述的语义结构扩展关键字匹配范围,避免完全机械的字符匹配造成的漏检,从而提高检索的查全率。在此基础上,利用领域本体中语义相关度过滤检索无关结果,以提高检索的查准率,并根据检索结果与本体语义相关度算法排序。  相似文献   

9.
提出了基于语义相似度和相关度的综合概念相似度计算方法.语义相似度考虑了语义距离和本体库特征,加入概念的信息量、概念的深度、概念的密度和不对称因子的辅助影响;语义相关度从直接相关、间接相关、直接继承和间接继承几个方面考虑.通过实验和两种传统的语义相似度计算方法进行对比,本方法能更好地区分本体树中不同关系的概念对,验证了该方法的有效性.  相似文献   

10.
基于主题图的本体信息检索模型研究   总被引:1,自引:0,他引:1  
针对本体在定义领域概念时具有规范性、明确性和可共享性等特点,结合主题图对文档资源组织方式具有语义可导航性,提出了一种基于主题图的本体信息检索模型,并给出了模型的形式化定义。选择旅游领域作为研究对象,定义了旅游本体和旅游文档资源主题图,分析了在信息检索模型中利用本体来规范用户自然语言查询输入,识别用户检索意图和扩展查询语义方面的作用,并展示了主题图在语义导航和用户相关度排序方面的价值。最后通过实验表明基于主题图的本体信息检索模型较传统的检索系统有较好的性能。  相似文献   

11.
一种基于本体的概念相似度计算及其应用   总被引:2,自引:0,他引:2  
概念的语义相似度研究,是知识表示以及信息检索领域中的一个重要内容。本文提出了基于语义相似度和相关度的综合概念相似度计算方法,考虑了语义距离和本体库特征,加入概念的信息重合度、概念的深度、概念的密度和不对称因子的辅助影响。通过实验和两种传统的语义相似度计算方法进行对比,本方法能更好地区分本体树中不同关系的概念对,验证了该方法的有效性。  相似文献   

12.
面向主题的概念检索研究   总被引:3,自引:1,他引:2  
该文提出了一种基于概念网络和主题概念树的面向主题的文本检索算法。依托概念网络建立主题概念树,利用主题概念树对用户的查询请求进行语义扩展,实现同义和语义蕴涵检索。关联度的计算模型考虑了词与词之间,句与句之间的语义激励。通过关联度在主题概念树上的传播模型,实现复合概念关联度的计算。检索结果按关联度大小降序排列。基于主题概念树的概念检索导航为用户检索提供了便利。  相似文献   

13.
随着本体在数据集成方面的广泛应用,面向本体的概念相似度计算成为人们关注的热点问题.针对当前领域本体概念相似度的计算过程都比较复杂的问题,提出一种基于树结构的本体概念相似度的计算方法.该方法通过添加和重组虚拟节点重构本体树,再通过属性比较映射对象,最后通过计算,得到本体概念的语义相似度结果.实验结果表明,该方法有效利用了本体概念的语义信息,得到了合理的计算结果,并简化了计算过程.  相似文献   

14.
钟将  宋娟 《计算机工程》2011,37(14):44-46
针对电力系统数据集成中存在的语义异构问题,提出一种基于本体的数据集成框架。依据电力参数估计系统的数据需求模型,分析数据集成存在的语义冲突类型,在传统数据集成框架的数据集成中间件模块中加入本体语义描述模块。采用本体描述信息资源域中的概念,通过实现语义冲突主动发现并构建语义映射关系。实验结果表明,该框架能有效解决数据集成过程中的语义异构问题。  相似文献   

15.
一种基于本体的概念语义相似度计算研究   总被引:2,自引:2,他引:0  
概念的语义相似度研究,是知识表示以及信息检索领域中的一个重要内容.通过分析两种传统的语义相似度计算方法,对它们存在的问题进行改进,提出了一种综合的基于本体的概念语义相似度计算方法.该方法结合本体网络特征和语义距离计算中的多种语义影响因素,充分利用本体中概念的语义信息计算概念间的语义相似度.实验结果比较合理,验证了该方法的有效性.  相似文献   

16.
基于上下文的领域本体概念和关系的提取*   总被引:5,自引:1,他引:4  
目前本体学习的研究重点在于概念及关系的提取,概念提取领域一致度与领域相关度相结合的方法取得了比较好的效果,而关系提取则主要采用基于关联规则的方法。这种本体概念、关系学习方法由于只考虑词频,提取结果准确性欠缺。针对这种缺陷,在统计的基础上考虑了语义因素,利用词汇上下文计算概念的语义相似度并将其应用到概念与关系提取中。实验结果表明,词汇上下文与传统统计相结合的方法能够有效改进概念和关系提取的准确度。  相似文献   

17.
基于本体结构的概念间语义相似度算法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对本体模型的结构特点,从模型概念间的宽度、深度、密度等方面分析本体概念相似度的计算,将其合并为结构因素。结合语义重合度、语义距离等影响相似度的因素综合考虑,提出一种基于本体结构的计算概念间语义相似度的算法。通过建立本体模型并进行实验分析,总结出本体结构方面各因素对本题概念语义相似度的影响。  相似文献   

18.
一种基于领域本体的混合信息检索模型   总被引:5,自引:2,他引:3       下载免费PDF全文
针对语义检索中本体不能提供所有知识的问题,提出一种基于领域本体的混合信息检索模型。该模型利用领域本体中概念间的语义关系,结合关键词检索和语义检索,建立关键词基础矩阵和语义扩展矩阵两层索引矩阵,使系统检索在没有可用本体知识时能自动调整为关键词检索,保证一定的检索性能。两者的结合有效改善了检索性能。  相似文献   

19.
面向语义信息查询的模糊本体模型   总被引:4,自引:0,他引:4       下载免费PDF全文
杨青  陈薇  闻彬 《计算机工程》2010,36(8):188-190
针对领域知识建模时的模糊性、不确定性与信息查询时的局限性,提出一种基于模糊控制规则的模糊本体模型。利用基于模糊聚类的本体机器学习方法构建模糊控制规则库,通过计算模糊相似矩阵得到模糊概念的语义关联,对词汇相关概念进行语义分析与扩展获取模糊概念间的本质语义关系,实现基于模糊概念属性值的信息查询与语义共用。实验结果表明,该模型在语义查询上有更完善的推理机制,能有效获取语义信息。  相似文献   

20.
基于个性化本体的图像语义标注和检索   总被引:1,自引:0,他引:1  
针对目前图像检索系统较难实现语义检索的问题,提出了一种新的以本体为核心的图像语义标注和检索模型。构建个性化本体描述图像语义,继而提取基于概念集的图像语义特征并利用本体中“Is-A”关系设计相似性度量方法最终实现语义扩展检索。其难点在于顶级本体向个性化本体进化,以及基于概念集和“Is-A”关系实现语义相似度量的方法。通过系统的初步实现与相关实验的验证,该模型的检索准确度可达88.6%,明显高于传统的基于关键字和基于通用本体的图像检索,实现了图像智能检索功能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号