共查询到20条相似文献,搜索用时 171 毫秒
1.
一种基于语义理解的元搜索引擎的研究 总被引:5,自引:0,他引:5
通过对查询短语的结构分析,发现查询短语通常由关键词和特征词构成。特征词是对网页内容的概括,它预示着网页中包含一组特定的特征词条。基于该思想建立了面向Web网页内容的特征库。以元搜索引擎为研究对象,研究了以Web网页内容特征库为基础实现对查询短语进行语义理解的方法,提出了相关度级别的算法,对库中已收入的特征词进行了查询测试,查准率为86.7%。实验表明,该模型基本实现了对查询短语的理解,对提高搜索引擎的查准率有显著的效果。 相似文献
2.
3.
4.
基于用户兴趣的查询扩展语义模型 总被引:1,自引:0,他引:1
罗建利 《计算机工程与应用》2006,42(32):126-130
自然语言中词的同义现象和歧义现象一直是降低信息检索查全率和查准率的关键,在Web搜索引擎上显得更加突出。提出了一种基于用户兴趣的查询扩展语义模型,通过构建基于Yahoo的语义ontology知识库消除同义现象,设计客户端的用户兴趣挖掘模型消除歧义现象。实验结果显示该方法能有效提高Web信息检索的查全率与查准率。 相似文献
5.
6.
Web信息检索技术已经在全世界广泛应用,然而,搜索引擎的查全率和查准率却不能够令用户满意,因此提出了一种基于通用本体WordNet的语义层次结构.通过计算和分析查询关键字与本体库的映射达到查询优化的目的.该方法通过建立一个简单的语法树并且索引WordNet,对查询关键字词法特性和本体实例之间语义关联强弱进行扩展和分析,提高了查询关键字到本体概念映射的完整性和准确率,进而帮助搜索引擎对用户的意图作出有效推测.实验表明,该方法可以有效地优化查询. 相似文献
7.
元搜索引擎的调度策略研究如何选择贴近需求的成员搜索引擎组合,以较小的资源耗费,帮助用户获得较高的查询质量.提出了一种基于检索术语分类的评价方法,根据成员搜索引擎的查全率、查准率和平均响应时间,量化其查询性能,然后根据评分高低,为每个分类的查询请求分配合适的成员搜索引擎组合.为该调度策略设计了实验系统,并对实验结果进行了分析与对比,结果表明,该调度策略有效地提高了查准率. 相似文献
8.
目前,常用的全文搜索引擎都是基于关键词检索的,其查准率和查全率都较低,并且返回记录太多,重复信息过多,使得搜索引擎的查询效率很低。基于此,提出了一种基于本体的搜索引擎模型,通过提取的文档中概念,确定其所属的领域本体,以此归类,并用文档—概念匹配系数建立索引。搜索时,采用基于概念匹配的方式进行检索,对属于不同领域本体的文档,分类输出。提高搜索引擎的查准率和查全率,减少冗余信息,从而提高搜索引擎的查询效率。 相似文献
9.
查询扩展是针对信息检索中常见的"词不匹配"问题提出的一种优化方法。通过分析现有查询扩展方法的不足,提出一种基于半监督学习的查询扩展模型,该模型将查询扩展看作一个分类问题,并采用直推式支持向量机对样本进行训练。实验结果表明该方法进一步提高了搜索引擎的查全率和查准率。 相似文献
10.
11.
12.
自然语言网络答疑系统的研究与实现 总被引:8,自引:0,他引:8
网络答疑是现代远程教育的重要组成部分,本文提出了一种基于自然语言的新型网络答疑系统的实现模型,介绍其实现原理及框架,并提出了从关键词、提问方式、提问重点三个层次对用户提问进行语义分析、特征向量提取及语义匹配的分析方法.实验结果表明,本文提出的关键技术解决方案能有效分析自然语言提问,提高问题答案匹配的精确率及召回率。 相似文献
13.
议论文自动生成是自然语言生成中一项极具挑战性的任务,与诗歌、故事等生成任务不同,所生成的文章需要句子语义明确、论证结构清晰并合理地表达出核心论点。上述特点使得现有的预训练模型难以准确地建模并自动生成,因此传统的检索式方法成为解决该问题的主要方式。但前人方法在句子检索和排序过程中只考虑了语义相关度,忽视了对逻辑论证关系的判别,导致语义不连贯、论证逻辑倒置等问题。针对上述问题,该文将自然语言推理应用于论证关系逻辑判别任务,提出了基于显式语义结构的论证关系逻辑判别方法,新模型在论证判别数据集上取得优于以往自然语言推理模型的效果。同时将论文判别结果作为显式特征应用于议论文句子排序模型,在议论文生成数据集中有效改善了排序模型的逻辑不一致问题并进一步提升了议论文生成系统的总体性能。 相似文献
14.
面对查询服务如何为用户提供满足需求的个性化推荐.提出一种基于自然语言进行评论分析、并提取特征属性进行多属性决策,为用户提供推荐排名策略,建立基于评论语义和Web挖掘技术的信息推荐系统实现个性化服务.解决了对同一商品的不同店铺之间的优劣比较和推荐,对各店铺的用户评论进行了主题抽取和情感分析,通过聚类成为”客户满意度”属性,与从店铺页面上爬取到的客观数据一起代入到推荐系统中进行计算.系统允许用户自主选择关心的属性及重要性排序,使得系统给出的推荐结果既能客观全面的反映店铺的状况,又能符合用户的评价偏好. 相似文献
15.
短文本的表示方法和特征提取方法是自然语言处理基础研究的一个重要方向,具有广泛的应用价值.本文提出了BERT_BLSTM_TCNN模型,该神经网络模型利用BERT的迁移学习,并在词向量编码阶段引入对抗训练方法,训练出包括句的语义和结构特征的且泛化性能更优的句特征,并将这些特征输入BLSTM_TCNN层中进行特征抽取以完成... 相似文献
16.
篇章分析是自然语言处理领域研究的热点和重点。相较于基于形式语法篇章分析的快速发展,篇章作为一个整体的语义单位,其功能和语义却没有引起足够的重视。该文提出一种融合全局语义信息和结构特征信息模型(FPRGS)来识别篇章的功能语用。该模型在获取篇章单元交互信息的同时融合篇章单元所在文章的全局信息,并使用门控语义网络将篇章单元的结构信息与语义信息结合,从而在语义和结构两方面获得了更加丰富的篇章单元信息。在汉语宏观篇章树库上的实验结果证明,该文提出的模型能够有效地识别篇章单元的功能语用。 相似文献
17.
通过分析已有的基于统计和基于语义分析的文本相似性度量方法的不足,提出了一种新的基于语言网络和词项语义信息的文本相似度计算方法。对文本建立语言网络,计算网络节点综合特征值,选取TOP比例特征词表征文本,有效降低文本表示维度。计算TOP比例特征词间的相似度,以及这些词的综合特征值所占百分比以计算文本之间的相似度。利用提出的相似度计算方法在数据集上进行聚类实验,实验结果表明,提出的文本相似度计算方法,在F-度量值标准上优于传统的TF-IDF方法以及另一种基于词项语义信息的相似度量方法。 相似文献
18.
文本相似度匹配是许多自然语言处理任务的基础,本文提出一种基于孪生网络和字词向量结合的文本相似度匹配方法,采用孪生网络的思想对文本整体建模,实现两个文本的相似性判断.首先,在提取文本特征向量时,使用BERT和WoBERT模型分别提取字和词级别的句向量,将二者结合使句向量具有更丰富的文本语义信息;其次,针对特征信息融合过程中出现的维度过大问题,加入PCA算法对高维向量进行降维,去除冗余信息和噪声干扰;最后,通过Softmax分类器得到相似度匹配结果.通过在LCQMC数据集上的实验表明,本文模型的准确率和F1值分别达到了89.92%和88.52%,可以更好地提取文本语义信息,更适合文本相似度匹配任务. 相似文献
19.
张培颖 《计算机工程与应用》2010,46(26):136-137
句子的相似度计算在自然语言处理的各个领域都占有十分重要的地位。提出了一种多特征融合的句子相似度计算模型,该计算方法把句子的词形、词序、结构、长度、距离和语义这6种特征相似度考虑进来,通过对不同的特征赋予不同的权重来调节各个特征对于句子相似度的贡献,从而使计算结果得到最优。实验结果表明,该方法与其他方法相比,描述句子的信息更加全面,在计算句子相似度方面具有较高的准确率。 相似文献
20.
Camilla B. Schwind 《Computational Intelligence》1990,6(3):172-178
In this paper, we present a formalism called feature grammar and its application to several problems of semantic analysis. Our extension concerns the structure of the feature value sets, which can be complex, and the definition of unification, which is dependent on this structure. Moreover, we introduce generation rules for feature symbols in order to determine well-formed symbols, which form the alphabet of a formal language for natural language analysis. 相似文献