首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 62 毫秒
1.
针对数学表达式表达形式多样、语法语义变换丰富给基于数学表达式的检索结果排序所带来的困难,提出一种基于IVHFS(Interval Valued Hesitation Fuzzy Sets)的数学表达式检索结果排序算法,利用IVHFS在排序中可以完整保留属性信息的优势,改善排序性能.首先,通过对数学表达式检索特征的归纳,确定数学表达式检索结果的排序属性;然后,利用所归纳的数学排序属性构造IVHFS集合;最后,采用IVHFS相似性测度计算出数学表达式之间的相似度,进而得出排序结果.本实验从公共数据集NTCIR-12_Math IR_Wikipedia_Corpus中获取了528188个数学表达式作为实验数据集,并设计了子式空间结构属性、运算符关联属性以及运算数关联属性作为评价指标,从而实现数学表达式检索结果的排序.实验结果表明,检索系统的查全率和查准率分别为75.8%和66.4%,其检索结果排序效果更加合理.  相似文献   

2.
《计算机工程》2018,(4):253-261
较普通数学公式而言,线性代数式结构复杂,语法、语义丰富,对其进行检索较困难。为此,对线性代数式检索进行分析,按照用户需求归纳其匹配模式,针对该匹配模式利用犹豫模糊集和线性代数式结构、符号、语法、语义等方面特征,从整体和局部两方面定义犹豫模糊隶属度,并建立线性代数式的相似度函数,从而进行基于犹豫模糊相似度的线性代数式检索结果排序。在6 352个公式上的实验结果表明,该方法能够实现线性代数式检索系统结果数据的有序输出。  相似文献   

3.
传统的文本检索技术主要面向一维文本,难以用于对二维结构数学表达式的检索.针对该问题,通过引入公式描述结构,实现基于运算符信息的数学表达式检索.利用公式描述结构提取算法获取LaTeX数学表达式的节点信息,从而得到公式骨架存储结构.在此基础上,选择运算符值为1的节点及其相关文档建立索引,并通过数学表达式匹配算法得到与输入相似的表达式集合.实验结果表明,该方法能够从519 588个数学表达式中快速、准确地找到相似表达式,并且不受一般运算数的影响.  相似文献   

4.
《计算机工程》2018,(3):201-207
现有的数学表达式检索模型大多面向普通数学表达式,在利用其检索线性代数表达式时,由于缺乏对线性代数表达式特征的考虑,检索效果较差。为此,设计针对线性代数表达式的检索方法。利用改进的数学公式描述结构表示La Te X格式的线性代数表达式特征,根据线性代数表达式的种类对其进行分类,并定义相应的扩充运算,据此构建索引文件,设计4种线性代数表达式匹配算法,实现灵活的检索模式,提高检索结果的相关性。实验结果表明,该方法符合线性代数表达式的检索特点,具有较合理的索引结构和较高的匹配效率。  相似文献   

5.
王宇  王芳 《计算机应用研究》2020,37(6):1769-1773
社区问答系统中充斥着大量的噪声,给用户检索信息造成麻烦,以往的问句检索模型大多集中在词语层面。针对以上问题构建句子层面的问句检索模型。新模型基于概念层次网络(hierarchincal network of concept,HNC)理论当中的句类知识,从句子的语用、语法和语义三个层面计算问句间相似度。通过问句分类算法确定查询问句和候选问句的问句类别,得到问句间的语用相似度,利用句类表达式的结构和语义块组成分别计算问句间的语法及语义相似度。在真实数据集上的实验表明,基于HNC句类的新模型提高了问句检索结果的准确性。  相似文献   

6.
基于领域本体和Lucene的语义检索系统研究   总被引:1,自引:0,他引:1  
王欢  孙瑞志 《计算机应用》2010,30(6):1655-1657
语义相似度是影响语义检索系统查准率和查全率的重要因素。设计了一种改进的语义相似度模型,用于量化概念间的关联程度,通过对相似度阈值的控制来调整查询扩展时扩展概念集的范围。在Lucene的基础上设计了一个基于领域本体的语义检索系统,该系统对提交的关键词组进行查询扩展后,将扩展关键词组导入文本检索引擎Lucene中,并把语义相似度作为检索结果排序算法的关键因素。实验结果表明,该语义相似度模型得出的相似度值更加接近专家经验值,系统的查询准确率与未加入查询扩展的Lucene系统相比有较大的提高。  相似文献   

7.
语义检索是解决信息检索中准确度、人性化要求的一个非常有潜力的方法。通过对知识文档进行主题词标注,然后建立从词元→主题词→知识文档的二级索引结构;对用户的检索,进行查询词到主题词的转化,计算语义相似度,按照语义相似度算法进行排序文档。目前基于知识文档的语义检索系统已经在某集团公司进行部署和应用,取得了前5项结果命中用户总查询90%的效果,说明这种方法是语义检索的一种有效途径。  相似文献   

8.
《计算机工程》2017,(6):129-135
数学表达式结构复杂多样,给检索带来困难。为此,提出一种数学表达式索引与检索方法。在索引阶段,通过对LaTeX数学表达式特点的分析与归纳,定义面向表达式二维结构特性的数学表达式特征表示方式,将互关联后继树索引模型应用于数学表达式索引的构建,以解决树结构表示表达式的层次增长问题。在匹配阶段,设计包括精确匹配、相容匹配、子式匹配、模糊匹配等查询模式的匹配算法。在浏览器/服务器模式下采用51 076条数学表达式进行索引与匹配。实验结果表明,提出的方法可加快查询速度,减小索引存储空间,能够适应数学表达式的结构特点,取得较好的检索效果。  相似文献   

9.
在传统的元搜索引擎中采用了Borda排序算法,即根据成员引擎检索结果的相关位置赋予一定分值,求和后按总分递减排序。这对各个成员引擎检索结果重叠度较高的检索排序非常有效,但对独立的搜索结果效果不好,速度较慢。另有根据检索字符串和检索结果的标题、摘要等相似度进行排序,这种排序快速,实现简单,但返回的信息简单,可能导致摘要信息多的排在前面,而不是内容相关的高的排在前面。针对这两种算法的不足,提出了一种改进的综合Borda排序算法,计算检索字符串和结果标题、摘要的相似度,再把相似度作为相关分值进行排序,它综合了两种算法。实验结果表明,他的查准率优于传统的Borda算法。  相似文献   

10.
顾昕  张兴亮  王超  陈思媛  方正 《计算机应用》2014,(Z2):280-282,313
为了提高图像检索的效率,提出一种基于文本和内容的图像检索算法。该算法采用稠密的尺度不变特征转换( DSIFT)构造视觉单词的方式来描述图像内容,依据基于概率潜在语义分析( PLSA)模型的图像自动标注方法获取的视觉语义对查询图像进行初步检索,在此结果集上对筛选出的语义相关图像按内容相似度排序输出。在数据集Corel1000上的实验结果表明,该算法能够实现有效的图像检索,检索效率优于单一的基于内容的图像检索算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号