首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
基于潜在语义分析的文档检索设计方法   总被引:1,自引:0,他引:1  
文档检索系统围绕如何基于语义层面进行检索来展开研究.基于关键词匹配的检索系统不能处理多词一义的情况,针对此问题设计了基于潜在语义分析的文档检索系统.首先改进了文档一词矩阵单元值的计算过程,调整了传统高频词与低频词在权重上的线性关系,利用Sigmiod函数对权重做平滑处理,使其更符合文档中词的权重;其次利用潜在语义分析结合多维尺度分析算法,优化计算文档在语义间的距离.实验结果显示,能有效在语义上聚类文档,完成查询语句与文档集之间的相似度检索计算.  相似文献   

2.
目的提出一种在文档图像中检索汉字的方法,解决快速检索文本图像问题.方法通过对文档图像的版面分割,找到版面上各个图形、图像和文本子区域.根据版面分割后抽取的子区域特征,采用遗传算法的基本思想,对每个文本图像子区域进行快速搜索.无需提取任何字符图像特征,也无需要遍历整个页面就可找到所需要的内容.结果在使用二值图像表达的文档中,也能够达到搜索字符的目的.结论在数字图书馆技术中,实现了搜索文档图像中符号信息内容,为数字资源的检索开辟了一种新的途径.  相似文献   

3.
随着计算机网络和多媒体技术的迅猛发展,针对大规模多模态图像检索的需求变得越来越广泛。如何有效解决多模态性,语义鸿沟和大规模性已经成为Web图像检索中的三大重要挑战。最近提出的语义标注和哈希技术可以分别用来解决语义鸿沟和大规模性,但它们无法涵盖目前存在的所有问题。在本文中,我们提出了语义关联多模态哈希用于多模态图像检索,它能够综合语义学习和哈希技术的优点。首先,通过基于图学习的半监督学习来增强训练样本的语义。然后构造所有样本的语义关联并将其保存在哈希函数中。学习出的哈希函数能够将所有模态均映射到统一的哈希空间中,从而支持多模态检索。在两个真实图像数据集上的实验结果证明了所提出方法的检索效果和效率。此外,实验结果也证明学习语义关联能够提高检索效果。  相似文献   

4.
当前由于电子政务发展迅速而引起的电子政务文档数量剧增,如何使用户能够提高检索文档信息查准率的同时提高检索的查全率已经成为一个热门问题。文章提出电子政务文档元数据的语义组织方法,包括文档集的资源描述框架模型的建立、合并以及检索词在文档中相似度的计算。对电子政务文档的智能搜索提出一种基于语义网检索的实现方法,结合语义网便于机器理解的优点,提高了检索集的查全率和查准率。  相似文献   

5.
一种基于内容的文档图像检索方法   总被引:1,自引:0,他引:1  
使用一个图像作为查询检索输入,根据该图像的版面分析特征、统计特征、纹理特征与数据库中图像的相似程度检索图像.该检索方法首先利用数学形态学对文档图像进行段落分割和行分割,作为文档图像的版面结构特征;然后根据图像的统计特征包括字符数、统计数特征、纹理特征给出文档图像抽取算法;最后给出检索算法模型.实验结果表明,本算法具有较好的查准率和查全率,在基于内容的文档图像检索中具有应用价值.  相似文献   

6.
结构化文档由标题、章节、段落等逻辑结构组成。利用文本文档中自然层次结构的优点,提出了一种新的相似度查找方法,用问题回答系统来实现。主要任务就是从底层的结构化文档集合中找到用户需要的最合适的答案。这种方法可以提供多粒度的文档内容的检索,包括从单词、短语到段落或者章节。用微软百科全书Encarta作为测试集,实验结果表明本文的方法能获得更加准确、简短的答案,同时提供更多关于问题的上下文信息,从而更好地理解答案。  相似文献   

7.
提出了基于语义和语法的服务检索方法. 采用语义相似度的方法对服务进行管理,以达到提高检索效率的目的;采用语法结构的方式,利用命题库模式对服务建模并提出检索算法,以提高服务检索的精确率. 以响应时间、召回率、精确率、综合评价指标为衡量指标,通过实验说明了结合语义和语法的检索方法的有效性.  相似文献   

8.
基于音节Lattice形式的语音识别结果来实现汉语语音文档检索,不但可以成功规避词表外词问题,而且Lattice这种多候选形式也能有效补偿识别错误对检索性能的影响.在基于音节Lattice的汉语语音文档检索研究中,针对已有索引方法的不足,提出了一种基于后验概率的索引方法,对向量空间模型进行改进,以音节和K步邻接音节对作为索引项,以它们在语音文档中的后验概率值作为索引项权重.检索实验表明,文中的方法更适用于基于音节Lattice的语音文档检索任务,各项改进都达到了预期效果.  相似文献   

9.
针对目前互联网环境下学习资源推荐方法无法满足用户垂直化、精准化以及个性化学习需求问题,探索融合学习资源维度、学习者维度以及情境维度的学习资源推荐方法.首先,构建学习资源推荐多维关联本体模型(MCOM),通过语义关系实现学习资源本体、学习者本体和情境本体关联;其次,设计动态自均衡二进制粒子群优化算法(DSEBPSO);最...  相似文献   

10.
基于FP-Growth算法在不产生侯选项集的情况下产生所有的频繁项集的思想上提出一种多维关联规则挖掘方法。该方法以数据立方体下的多维数据为研究对象,通过挖掘频繁谓词集发现多维关联规则,并通过理论和实例验证的方法证明了该方法的可行性。  相似文献   

11.
针对多媒体信息检索中的"语义鸿沟"问题,提出了矩阵分裂方法的定义及其基本运算准则,描述了适用于多种多媒体信息的高层语义框架,利用该框架对多媒体信息进行高层语义检索,解决了检索多媒体信息的"语义鸿沟"问题.针对该框架提出了基于每次用户检索结果的部分优先算法,利用用户每次检索结果对高层语义分支权重进行自适应调整,从而达到提...  相似文献   

12.
基于关键词匹配的检索方法存在不足,使用分布式大数据处理技术,基于本体对用户输入的查询关键词进行查询扩展,利用Lucene针对扩展后的关键词进行检索,按照语义相似度将检索结果排序后返回给用户。实验表明,基于本体的语义检索系统在查全率和查准率两个方面均优于传统检索方法。  相似文献   

13.
针对传统P2P系统大多采用关键字匹配实现信息检索且不支持语义的问题,提出了一个基于本体的P2P语义检索框架。该框架采用超级节点拓扑结构,利用本体进行信息集成,将支持相似概念的节点聚类到同一语义对等组,组内节点依据本体定义使用语义链来连接,组之间语义关联则通过超级节点的组语义链来实现;同时增加语义快捷链实现不同语义组之间的节点连接。  相似文献   

14.
数字图书馆中文本信息检索技术的研究与实现   总被引:3,自引:0,他引:3  
介绍了一个并行数字图书馆原型系统PDL,和用于该系统的针对文本信息检索的一些数据结构,包括倒排索引,结构索引,RANK索引和词典等,并在此结构的基础上设计实现了基于内容和结构的查询算法。这些算法以计算机机群并行环境为基础.实验表明并行数据查询具有良好的性能。  相似文献   

15.
针对三维模型检索系统提高准确率、减少几何特征和人类语义丰富性之间的“语义鸿沟”等问题, 提出一种基于高斯过程的语义分类和检索新方法.该方法采用一种统计2个采样点相对质心向量夹角的AC2直方图新特征,与形状分布的D2特征组合成低层特征,使用高斯过程进行三维模型语义分类的监督学习,计算测试模型的语义类概率预测分布,建立低层特征和查询概念之间的联系;使用语义距离和不相似度计算方法进行检索排序.实验结果表明:与已有的某些监督学习的方法相比,多类的测试模型进行语义分类的准确率明显得到提升,检索中能体现语义概念,检索性能也得到提高.  相似文献   

16.
传统的语义信息检索是基于检索词语义的匹配,无法满足检索不确定的、不完整的信息以及对检索结果进行聚类处理,因此,提出将模糊本体引入语义信息检索方法。该方法以本体技术先建立领域语义模型,各概念的隶属度加到语义建模的过程中,并提供语义标注;以模糊推理方式对概念、公理等本体进一步处理,从而便于计算机计算处理。能够提高在语义信息检索中对模糊信息进行检索的查准率、查全率,采用聚类技术对检索结果进行聚类,以达到智能化检索的目的。  相似文献   

17.
针对传统的信息检索系统存在的不足,本文提出了一种语义智能检索系统结构,并实现了在农业果品领域中的应用.实验证明,该语义智能检索系统能够检索到与关键字语义相关的信息,如同义、近义及上下位关系,并在一定程度上解决了"信息过载".  相似文献   

18.
三维模型检索是多媒体信息检索领域的重要组成部分,由于"语义鸿沟"的存在使得当前基于内容的检索结果通常不十分令人满意。考虑到解决"语义鸿沟"的关键是将三维模型的底层形状特征与高层语义特征进行有效融合,为此提出一种三维模型的语义与形状异构特征融合方法,该方法将三维模型在基于内容的检索过程中用户反馈信息形成的语义关联作为模型的语义表达,并通过子空间学习方法将这种语义表达信息与模型的底层特征进行融合,最后将融合后的新特征应用于三维模型检索中。在Princeton shape benchmark上的测试表明,该方法的检索结果明显好于单纯形状特征的检索结果。  相似文献   

19.
为满足各异构地理信息系统之间地理数据共享的需求,为用户提供更全面、更智能化的地理服务,提出了一种基于语义Web的异构地理信息数据集成方法。将语义本体、Web服务和地理信息系统相结合,通过Web技术实现各异构地理信息系统的数据互通互联,并建立统一的地理信息本体库对地理数据进行识别,替代传统的地理数据格式转换方法。最后结合KML标准、Protégé等工具对该数据集成方法进行实际印证,取得了较为理想的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号