首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 978 毫秒
1.
王宇  王芳 《计算机应用研究》2020,37(6):1769-1773
社区问答系统中充斥着大量的噪声,给用户检索信息造成麻烦,以往的问句检索模型大多集中在词语层面。针对以上问题构建句子层面的问句检索模型。新模型基于概念层次网络(hierarchincal network of concept,HNC)理论当中的句类知识,从句子的语用、语法和语义三个层面计算问句间相似度。通过问句分类算法确定查询问句和候选问句的问句类别,得到问句间的语用相似度,利用句类表达式的结构和语义块组成分别计算问句间的语法及语义相似度。在真实数据集上的实验表明,基于HNC句类的新模型提高了问句检索结果的准确性。  相似文献   

2.
自动问答系统问句相似度计算的准确率直接影响系统返回答案的准确率,对此提出一种基于Word2vec和句法规则的问句相似度计算方法。构造Text-CNN问句分类模型将问句进行分类,再构造Word2vec词向量模型将问句中词与词的空间向量相似度转换成语义相似度,并加入句法规则的分析。随机从搜狗公开问答数据集中抽取200条数据进行测试,结果表明,该方法与TF-IDF方法相比,自动问答系统返回答案的准确率和召回率分别提高了0.259和0.154。  相似文献   

3.
赵一鉴  林利  王茜蒨  闻鹏  杨东 《计算机应用》2023,(11):3594-3598
目前基于相似度的移动目标轨迹预测算法一般根据数据的时空特性进行分类,无法体现算法自身的特点,为此提出一种基于算法特征的分类方法。轨迹相似度算法通常需要先计算两点之间的距离,再开展后续计算,而常用的欧氏距离(ED)只适用于目标在小区域范围内移动的问题。针对现有基于相似度的轨迹预测算法无法适用于移动范围比较大的海上目标轨迹预测的问题,提出使用大地距离代替ED进行相似度计算。首先,对轨迹数据进行预处理和分段;其次采用离散弗雷歇距离(FD)作为相似性度量;最后,利用模拟数据和实际数据进行测试。实验结果表明,当海上目标移动范围较大时,采用ED算法可能会得到不正确的预测结果,而所提算法可输出正确的目标轨迹预测结果。  相似文献   

4.
FAQ问答系统是一种在已有的"问题—答案"对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的系统。句子相似度计算是FAQ问答系统的关键技术,系统通过句子相似度算法计算用户问句与FAQ库中的问句的相似度,把相似度最大的问句答案返回给用户。因此,句子相似度算法的好坏直接决定了系统结果的准确度。文章给出了一个基于格语法的句子相似度计算方法,通过加入格语法的语义分析提高句子相似度算法的准确度。  相似文献   

5.
基于概念图的中文FAQ问答系统   总被引:1,自引:1,他引:0  
卜文娟  张蕾 《计算机工程》2010,36(14):29-31
提出一种利用概念图计算问句相似度的方法,并在此基础上实现基于概念图的中文FAQ问答系统,在该系统中采用概念图的形式表示用户问句及在FAQ库中找到的候选问句集中的问句,通过改进的概念图语义相似度计算问句相似度,在候选问句集中找到相似的问句并将答案返回给用户。该系统能够自动更新和维护FAQ库。实验结果表明,与基于关键词的句子相似度相比,基于语义的句子相似度提高了问题匹配的准确率。  相似文献   

6.
电力结构化小文本搜索过程中,由于知识库的差异,使得用户搜索查询词修改率较高,无法满足用户搜索需求。为此,提出了基于意向决策支持的结构化小文本电力搜索引擎技术。根据Web页面的链接关系,通过该URL与主题的相关度计算结果,完成采集数据的处理。根据意向决策支持技术,明确用户意向决策支持结果。构建情景设定知识库、情景分析知识库,并构建情景设定知识库、情景分析知识库,作为电力搜索引擎的运行基础。根据查询目标向量和电力搜索记录,计算相似度两者相似度。利用欧式语义距离计算电力搜索目标向量相似度,将相似度最高的查询结果作为结构化小文本搜索引擎算法的输出结果。实验结果表明:所提出的电力搜索引擎技术与常规技术相比,平均查询词修改率降低了23%、19%。  相似文献   

7.
针对传统数据异常智能检测技术无法实现检测率与误检率同步的问题,提出一种基于云计算的数据异常智能检测技术。该技术结合聚类分析算法,通过计算相似度实现异常数据与正常数据之间的分类,从而达到数据异常检测的目的,其过程如下:首先对待检测数据进行预处理,然后从预处理后的数据中提取代表性特性,接着计算待检测数据与数据特征之间的相似度,并按照相似度大小筛选出异常数据,最后进行异常数据响应,并进行相应处理。结果表明:与结合神经网络算法、深度学习算法、随机森林算法等传统数据异常检测技术相比,本技术在保证检测率的同时,降低了误检率,误检率分别降低0.19%,0.4%、0.53%。  相似文献   

8.
针对传统的协同过滤(CF)推荐算法中存在的数据稀疏性和推荐准确率不高的问题,提出了基于多源信息相似度的微博用户推荐算法(MISUR)。首先,根据微博用户的标签信息运用K最近邻(KNN)算法对用户进行分类;然后,对得到的每个类中的用户分别计算其多源信息(微博内容、交互关系和社交信息)的相似度;其次,引入时间权重和丰富度权重计算多源信息的总相似度,并根据其大小进行TOP-N用户推荐;最后,在并行计算框架Spark上进行实验。实验结果表明,MISUR算法与CF算法和基于多社交行为的微博好友推荐算法(MBFR)相比,在准确率、召回率和效率方面都有较大幅度的提升,说明了MISUR算法的有效性。  相似文献   

9.
基于FAQ的自动答疑系统的设计与实现   总被引:1,自引:0,他引:1  
设计并实现了一个基于FAQ的自动答疑系统。阐述了自动答疑过程的主要环节和基本流程,介绍了系统实现的关键技术,包括改进的汉语自动分词算法、问句关键词的提取与同义词变换、疑问词分类与知识点分类相结合的问题分类法、根据用户问题建立候选问题集和问句相似度计算等。实验表明,答疑系统对用户问题的回答具有较高的准确率。  相似文献   

10.
针对传统基于用户的博文内容和共同好友数在计算微博用户的相似度时存在潜在误差过大的问题、而基于用户多源背景信息的相似度计算模型有计算复杂度高且忽略了用户的兴趣等问题,提出了一种结合用户兴趣和背景信息的综合相似度计算方法(BIBS)。首先从用户的标签中提取用户的兴趣,当用户的标签缺失时,通过对用户关注关系网络中的重要用户聚类来间接获取用户的兴趣点,以此计算用户的兴趣相似度;其次根据用户的性别、年龄和地点等背景属性计算用户的背景相似度,层次化地挖掘出最相似的用户;最后基于新浪微博的数据进行实验分析。结果表明,与基于多源信息相似度的微博用户推荐算法(MISUR)相比,该方法在用时更少的情况下,准确率、召回率和◢F◣值分别提高了8.1%、16.7%和13.6%,证明了提出的BIBS方法的有效性和准确性。  相似文献   

11.
基于语义扩展的短问题分类   总被引:1,自引:0,他引:1  
问题分类是问答系统任务之一。特别是语音交互方式中,用户的提问较短,具有口语化特征,利用传统文本分类方法对问题进行分类的效果不佳。为此提出一种基于语义扩展的短问题分类方法,该方法使用搜索引擎对问题进行知识扩展;然后,使用主题模型进行特征词选择;最后,利用词语相似度计算获取问题的类别。实验结果表明,所提方法在1365条真实问题集上平均F-measure值达到0.713,其值高于支持向量机(SVM)、K近邻(KNN)算法和最大熵方法。因此,该方法在问答系统中可以帮助系统提升问题分类的准确率。  相似文献   

12.
问答社区中候选答案过多会增加提问用户选择最佳答案的负担。为此,提出一种基于概率潜在语义分析(PLSA)模型的自动答案选择方法。在主题建模思想的基础上,利用问答社区中的用户资料,以PLSA模型表达问答社区中的用户兴趣分布,依据答案和问题之间的主题匹配度对候选答案进行排序。实验结果表明,该方法可有效挖掘用户兴趣,提高答案选择的准确率。  相似文献   

13.
文中研究的是基于常问问题库(FAQ库)的智能答疑系统。FAQ库是很多智能答疑系统中的一个重要组成部分,它把用户常问的问题和相关答案保存起来,对于用户输入的问题,可以首先在FAQ库中查找答案。如果能够找到相似的问题,就可以直接将问题所对应的答案返回给用户。为解决智能答疑系统因词的同义或多义现象而导致的“漏答”或“错答”,采用一种基于加权潜在语义分析模型的相似度计算方法。针对特定教育领域的智能答疑系统.改进了反映词与词之间相关性的权值计算。通过对特定课程中常问问题的实验,结果显示明显优于向量空间模型。  相似文献   

14.
在搜索引擎、问答系统中利用深度学习的方法计算问题相似度是NLP领域研究的热点.结合卷积神经网络(CNN)和长短记忆网络(LSTM),提出了递归卷积神经网络(RCNN)问句相似度的计算方法,首先利用双向递归神经网络提取上下文信息,然后采用1D卷积神经网络将词嵌入信息与上下文信息进行融合;再利用全局最大池化提取关键信息来完...  相似文献   

15.
问句分类在问答系统领域有着重要的研究意义和应用价值。为了提高自动问句分类识别效率,本文提出了基于藏文疑问虚词的问句分类方法。该方法首先提取问句中的藏文虚词;然后根据所得的虚词进行问句分类;其次,进一步将问句细分为问题大类和小类;最后,给问题贴上分类标签。这种方法,既缩小了检索空间又提高了答案的准确性。最后对各种藏文问句分类的准确性进行了测试。结果表明基于藏文虚词问句的分类方法具有可行性和实用性。  相似文献   

16.
判断问题相似是社区问答(community question answer, CQA)中很重要的一个研究方向.社区问答中的问题通常由主题和描述构成.由于社区问答的开放性,用户的提问长短不一,而问题中会包含大量干扰模型判断问题是否相似的背景信息.为了减少上述问题对计算问题相似度的影响,模型将关键词及问题主题视为问题的关键信息,并使用这些信息计算问题相似度.首先,在基于文本间相似及相异信息的CNN模型的基础上引入了关键词抽取技术.同时,为了更好地利用问题主题的信息,模型融合了问题主题相似度的特征.模型在SemEval2017评测的问题相似任务中进行了实验,其平均精度均值(mean average precision, MAP)达到了49.65%,超过了评测中的最佳结果.  相似文献   

17.
基于依存关系的问句理解与问句分类   总被引:1,自引:0,他引:1  
问句理解是问答系统的首要过程,问句分类是问句理解的主要组成部分,它在问答系统中具有非常重要的作用,因为问句类型有助于在文档中定位和抽取答案。问句分类的目标是基于预期的答案类型,准确地分类问句。本文提出依存关系规则与统计方法相结合,实现了基于依存关系的中文问句理解与问句分类机制。实验表明:支持向量机结合依存关系的特征抽取方法,获得了较高问句分类正确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号