共查询到10条相似文献,搜索用时 62 毫秒
1.
针对数学表达式表达形式多样、语法语义变换丰富给基于数学表达式的检索结果排序所带来的困难,提出一种基于IVHFS(Interval Valued Hesitation Fuzzy Sets)的数学表达式检索结果排序算法,利用IVHFS在排序中可以完整保留属性信息的优势,改善排序性能.首先,通过对数学表达式检索特征的归纳,确定数学表达式检索结果的排序属性;然后,利用所归纳的数学排序属性构造IVHFS集合;最后,采用IVHFS相似性测度计算出数学表达式之间的相似度,进而得出排序结果.本实验从公共数据集NTCIR-12_Math IR_Wikipedia_Corpus中获取了528188个数学表达式作为实验数据集,并设计了子式空间结构属性、运算符关联属性以及运算数关联属性作为评价指标,从而实现数学表达式检索结果的排序.实验结果表明,检索系统的查全率和查准率分别为75.8%和66.4%,其检索结果排序效果更加合理. 相似文献
2.
3.
4.
5.
社区问答系统中充斥着大量的噪声,给用户检索信息造成麻烦,以往的问句检索模型大多集中在词语层面。针对以上问题构建句子层面的问句检索模型。新模型基于概念层次网络(hierarchincal network of concept,HNC)理论当中的句类知识,从句子的语用、语法和语义三个层面计算问句间相似度。通过问句分类算法确定查询问句和候选问句的问句类别,得到问句间的语用相似度,利用句类表达式的结构和语义块组成分别计算问句间的语法及语义相似度。在真实数据集上的实验表明,基于HNC句类的新模型提高了问句检索结果的准确性。 相似文献
6.
基于领域本体和Lucene的语义检索系统研究 总被引:1,自引:0,他引:1
语义相似度是影响语义检索系统查准率和查全率的重要因素。设计了一种改进的语义相似度模型,用于量化概念间的关联程度,通过对相似度阈值的控制来调整查询扩展时扩展概念集的范围。在Lucene的基础上设计了一个基于领域本体的语义检索系统,该系统对提交的关键词组进行查询扩展后,将扩展关键词组导入文本检索引擎Lucene中,并把语义相似度作为检索结果排序算法的关键因素。实验结果表明,该语义相似度模型得出的相似度值更加接近专家经验值,系统的查询准确率与未加入查询扩展的Lucene系统相比有较大的提高。 相似文献
7.
语义检索是解决信息检索中准确度、人性化要求的一个非常有潜力的方法。通过对知识文档进行主题词标注,然后建立从词元→主题词→知识文档的二级索引结构;对用户的检索,进行查询词到主题词的转化,计算语义相似度,按照语义相似度算法进行排序文档。目前基于知识文档的语义检索系统已经在某集团公司进行部署和应用,取得了前5项结果命中用户总查询90%的效果,说明这种方法是语义检索的一种有效途径。 相似文献
8.
9.
在传统的元搜索引擎中采用了Borda排序算法,即根据成员引擎检索结果的相关位置赋予一定分值,求和后按总分递减排序。这对各个成员引擎检索结果重叠度较高的检索排序非常有效,但对独立的搜索结果效果不好,速度较慢。另有根据检索字符串和检索结果的标题、摘要等相似度进行排序,这种排序快速,实现简单,但返回的信息简单,可能导致摘要信息多的排在前面,而不是内容相关的高的排在前面。针对这两种算法的不足,提出了一种改进的综合Borda排序算法,计算检索字符串和结果标题、摘要的相似度,再把相似度作为相关分值进行排序,它综合了两种算法。实验结果表明,他的查准率优于传统的Borda算法。 相似文献