首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
基于统计语言模型的信息检索   总被引:4,自引:0,他引:4  
本文对基于统计语言模型的信息检索进行了综述,介绍了目前基于统计语言模型信息检索中比较有代表性的模型,给出了语言模型估计中常用的几种平滑技术,将语言模型同目前流行信息检索模型进行了比较,在此基础上,指出了基于统计语言模型信息检索的研究方向。  相似文献   

2.
基于向量空间模型的中文信息检索技术研究   总被引:15,自引:1,他引:15  
该文运用在西文信息检索中非常成功的向量空间模型来解决中文信息检索的问题,在中文文档的特征项抽取,加权、相似度计算,模型的建立等方面做了一些探讨,并建立系统原型,在小范围内进行了测试。  相似文献   

3.
乔亚男  齐勇  史椸  侯迪  王晓 《计算机科学》2009,36(7):197-201
传统的信息检索模型假设查询中的关键词之间是并列关系,但用户的需求往往应该被抽象为一系列的关键词组,组内的关键词间具有更为紧密的语义关系,这就是定义的临近词检索问题.提出了基于权重矩阵的临近词检索问题解决框架,该框架将文档和查询抽象化为文档的权重矩阵表示和查询权重矩阵,通过计算两个矩阵间的相似度来实现临近词检索.实验结果证明,针对临近词检索问题,传统的信息检索模型只是一种简化问题的解决方案,权重矩阵框架从理论上和形式上更加契合临近词检索问题,查准率得到了显著的提高.  相似文献   

4.
信息过滤已成为当今信息技术研究的热点。主要介绍布尔模型、向量空间模型和概率模型,并分析它们各自的优点及存在的不足之处。在此基础上,提出一种新的信息过滤模型——基于本体论的信息过滤模型,阐述用户兴趣模板的构建步骤、用户相关反馈和更新算法,为基于本体的信息过滤技术提供了理论基础。  相似文献   

5.
基于加权的向量空间检索模式   总被引:3,自引:0,他引:3  
介绍了向量空间检索模式的基本原理,并针对其不能区分每个术语(term)在文档中出现的次数的缺点,提出了一种基于加权的改进的向量空空间检索模式,很好地改进了此不足。  相似文献   

6.
基于向量空间模型的信息检索技术是较为成熟且应用广泛的信息检索技术,该技术将文档和查询信息均用向量空间表示,查询匹配问题转化为向量空间的矢量匹配问题,文档与查询的相似度可用向量之间的夹角来度量.信息检索速度是衡量信息检索技术好坏的重要指标,基于向量空间模型的信息检索之串行算法的计算复杂度为θ(n^3),本文提出了一种在Hypercube SIMD模型上的并行算法,其时间计算复杂度为θ(nlogn),该算法与传统的串行算法相比,能显著地提高查询速度.  相似文献   

7.
基于多层向量空间模型的Web信息检索方法   总被引:1,自引:0,他引:1  
雷景生 《计算机应用》2004,24(4):26-27,30
针对Web信息检索的特点,在分析传统向量空间模型存在问题的基础上,提出了一种多层向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段。按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。  相似文献   

8.
基于改进向量空间模型的Web信息检索技术研究   总被引:12,自引:1,他引:12  
提出了一种改进的向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。  相似文献   

9.
有效地检索HTML文档   总被引:22,自引:1,他引:21  
WWW上的资源大多以HTML格式的文档存储,同普通文档不同,THML文档的标签特性使得它具有一定的结构我们采取了一种检索,它扩展了传统的传统检索,利用HTML文档结构提高了在WWW环境下的检索和率。本文介绍了HTML的结构以及传统的向量空间信息检索提出了运用聚族方法为标符合分组;最后详细讨论了如何利用文棣结构扩展加权架,使得检索词能更贴切地描述文档,以提高检索的准确性。  相似文献   

10.
对基于向量空间模型的检索方法进行改进,提出基于本体语义的信息检索模型。将WordNet词典作为参照本体来计算概念之间的语义相似度,依据查询中标引项之间的相似度,对查询向量中的标引项进行权值调整,并参照Word-Net本体对标引项进行同义和上下位扩展,在此基础上定义查询与文档间的相似度。与传统的基于词形的信息检索方法相比,该方法可以提高语义层面上的检索精度。  相似文献   

11.
向量空间模型是最常用的信息检索模型,它根据词频来计算文档之间的相关度,这种方法虽然能够满足用户的基本检索需求,但是对于检索要求较高的用户,其效果仍然不甚理想。文中在向量空间模型的基础上,首先通过领域本体和上层本体来计算特征词项之间的相似度,据此得出与查询词相关的词,在求词项频率和逆文档频率时考虑这些词,然后引入了词序相关度和词语相邻相关度这两个概念,把特征项的位置关系也考虑进来。实验结果表明,文中提出的模型相比原始向量空间模型,在准确率上有了较大的改善。这完全说明,与原始向量空间模型相比,文中提出的检索模型不仅考虑了与原有词项具有相似语义的词项,而且还考虑了词项顺序和词项相邻信息,从而更能符合用户的检索要求。  相似文献   

12.
检索相关设计方案以复用是提高建筑设计效率的有效手段。针对传统的三维形状检索方法对建筑模型空间结构表达能力不足的问题,提出一种基于拓扑特征的建筑信息模型检索方法。首先利用Revit API开发插件提取建筑信息模型房间连接拓扑图(Room Connectivity Topology Graphs,RCTG),然后结合空间句法理论构造建筑空间构形节点深度值表(Node Depth Value Table,NDVT)并过滤出候选模型,进而将检索模型和候选模型的NDVT转换为标准化的邻接矩阵并提取相应的特征向量,最后通过相似性度量得到检索结果。实验结果表明,该方法能够有效实现建筑模型局部结构的检索,与单一考虑形状特征的传统三维检索方法相比,检索精准度较高,能够实现建筑模型的高效再利用,具有广泛的应用前景。  相似文献   

13.
基于本体的Web文本挖掘与信息检索   总被引:1,自引:0,他引:1       下载免费PDF全文
艾伟  孙四明  张峰 《计算机工程》2010,36(22):75-77
针对传统Web文本挖掘技术缺少语义理解能力的不足,提出并实现一种基于本体的Web文本挖掘模型,即利用基于本体概念体系的向量空间模型替代传统的向量空间模型来表示文档,在此基础上进行Web文本挖掘,并给出一种集成语义信息检索的设计。实验结果初步验证了本体模型在Web文本挖掘技术上应用的可行性。  相似文献   

14.
一种基于领域本体的混合信息检索模型   总被引:5,自引:2,他引:3       下载免费PDF全文
针对语义检索中本体不能提供所有知识的问题,提出一种基于领域本体的混合信息检索模型。该模型利用领域本体中概念间的语义关系,结合关键词检索和语义检索,建立关键词基础矩阵和语义扩展矩阵两层索引矩阵,使系统检索在没有可用本体知识时能自动调整为关键词检索,保证一定的检索性能。两者的结合有效改善了检索性能。  相似文献   

15.
本文介绍了一个Web维文信息检索系统,此系统根据用户设定的主题对指定的网站进行信息检索。该系统采用在西文信息检索中非常成功的向量空间模型来解决维文信息检索的问题,在维文文档的特征项抽取,加权、相似度计算,模型的建立等方面做了一些探讨,提出了一种针对解决基于网络的维文信息处理(如:维文网页下载,网页内容信息的存储,以及维文检索)的方法。文中论述了系统的设计思想和相关的算法以及实现技术。  相似文献   

16.
本文介绍了一个Web维文信息检索系统,此系统根据用户设定的主题对指定的网站进行信息检索。该系统采用在西文信息检索中非常成功的向量空间模型来解决维文信息检索的问题,在维文文档的特征项抽取,加权、相似度计算,模型的建立等方面做了一些探讨,提出了一种针对解决基于网络的维文信息处理(如:维文网页下载,网页内容信息的存储,以及维文检索)的方法。文中论述了系统的设计思想和相关的算法以及实现技术。  相似文献   

17.
本文讨论了云模型的基本概念和相联规则的含义.从应用的角度提出一种新的相联规则智能信息获取方法CM-T,并给出了算法的步骤和度量标准.由于云模型较好地软化了数量属性论域的划分边界,从而为进一步满足Web信息检索提供一种个性化的高效信息检索工具.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号