首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
针对由于微博文本的数据特性造成的传统信息搜索方法无法直接实现微博话题内容搜索的问题,提出了一种基于卷积神经网络的微博话题内容搜索方法,对微博安全话题内容进行搜索和匹配排序。该方法包括基于深度卷积神经网络的微博内容筛选和微博内容匹配两部分。微博内容筛选依据深度卷积特征表示进行微博内容筛选,微博内容匹配通过卷积特征非线性变换对筛选结果进行匹配排序。微博内容筛选和微博内容匹配对国民安全话题相关的微博文本内容局部特征进行处理,对筛选结果进行相似度计算从而实现相似度匹配。实验结果表明该方法在微博搜索性能上优于现有同类方法,并验证了所提出方法针对安全话题的微博文本内容搜索的有效性。  相似文献   

2.
针对高考咨询问题重复性高、搜索引擎回答较为冗余等现状,从各网站的半结构化以及非结构数据中抽取知识三元组,构建高校信息知识图谱;对涉及多种约束的复杂问句的问答方法进行研究,提出一个基于语义解析的问答模型,通过对问句的解析将问句自动转换为Neo4 j查询语句.实验结果表明,该系统能较为准确地回答大部分领域问题,为其他领域类问答系统的实现提供了借鉴.  相似文献   

3.
基于Agent的智能元搜索引擎技术研究   总被引:2,自引:0,他引:2  
针对现有搜索引擎存在的问题,提出基于Multi-agent的分布式搜索引擎系统.系统采用元搜索引擎结构,利用Agent技术和基于个性化模式的信息过滤技术,使系统具有一定的智能性.通过个性化检索和分类浏览相结合的检索方式可提高搜索结果的可浏览性.结合数据库的分类和虚拟语言模型方法实现了资源选择的优化.提出基于文本/位置分析和群决策的合并算法,对搜索结果的标题和文档片断信息进行相关度分析,将文本分析与规范化的搜索结果位置信息相结合,计算文档的相关分值,最后采用基于群决策的合成方法对搜索结果进行一致性排序.试验结果表明,提出的元搜索系统具有较好的搜索效果.  相似文献   

4.
智能问答系统是在搜索引擎的基础上融合了自然语言知识和应用的人工智能产品,相比较传统的依靠关键字匹配的搜索引擎,能够更好地满足用户的查询需求。针对现有的英语智能问答系统中知识呈现的单一化以及系统查询效率低等现状,采用基于距离的相似度算法,设计并实现了基于相似度算法的英语智能问答系统。实验结果表明该系统能够较为准确地回答小学生的英语问题,对远程教育中小学英语智能问答系统的构建起到参考和借鉴的作用。  相似文献   

5.
针对高考志愿填报录取最优化、最佳匹配问题,提出了基于遗传算法搜索最优解的解决方案。该方案模拟物种自然选择和遗传进化过程,将不同考生的高考志愿按录取结果利益最大化进行排序。在可选择院校数量相同的情况下,对不同考生考试成绩的数据通过程序不断进行智能优化和迭代,志愿排序结果趋于稳定,且达到最佳匹配。其不但满足考生的实际需求,而且达到志愿填报利益最大化的目的。该方法采用涵盖985、211、普通院校的10所高校的实际数据进行测试,结果表明,遗传算法可以用来求解最优高考志愿填报排序问题,且具有很高的准确率和适应度。  相似文献   

6.
搜索引擎结果聚类对提高搜索引擎服务质量和智能化水平有较高的应用价值,它是从标题和文档片段的有限信息中寻找文档相关度进行聚类。传统搜索引擎聚类没有充分利用搜索引擎结果的自身特点,或者计算复杂度较高。本文提出了一种基于主题词匹配频数的搜索引擎聚类算法,该算法从高频词中筛选出主题词,根据主题词共现情况自动产生类别,其他结果依据满足与类别主题词表的匹配频数的文档数进行聚类。实验结果与STC和LINGO算法相比,搜索质量有所提高。  相似文献   

7.
Web上实体信息过于分散且缺乏语义,传统基于关键词匹配的搜索引擎往往因缺少上下文等语义信息,无法搜索到精确的结果。为了对Web数据进行精确查找,使用信息网模型(INM)对Web数据进行语义表示和建模,将实体的所有语义信息组织在一个对象中,快速获取实体完整的语义信息。基于INM构建复杂语义数据库,设计实现一个可对教育领域相关实体信息进行精确搜索的TLDW系统。实验结果表明,该系统初次查询时间均在100 ms内,其搜索结果包含实体的上下文关系等多种语义信息,缓存优化后的搜索结果可在20 ms内完成。  相似文献   

8.
随着计算机技术与数据库学科不断发展,数字化信息已经成为当今存储数数据的首要选择,并且借助大型搜索引擎,使用户可以快速找到对应信息。应用于企业级的高效搜索引擎成为当前研究的重要课题。本文提出了基于关键词筛选KWS(Key Word Selection)的搜索引擎机制,针对电网与大型发电厂智能管理系统的数据结构,通过构建双字哈希词典和双字耦合消歧分词与结果的语义筛选,将筛选后的分词结果放入Sphinx和MySQL数据库进行全文搜索并加以缓存,既提高了搜索速度又提高搜索的准确度。  相似文献   

9.
针对大数据量数据资源的简洁、快速搜索问题,深入研究了基于Lucene的分布式弹性搜索引擎ElasticSearch,简单分析了它的基本原理,详细描述了它的技术框架,并基于ElasticSearch搜索引擎,开发实现了公安信息资源整合与搜索系统,实现了大数据量信息资源的快速整合与一键式分布式准实时搜索,通过可视化监控界面,实时了解系统数据同步与搜索性能,为不断优化其性能奠定了坚实基础.  相似文献   

10.
针对目前精品课程网站视频信息多、分布散的特点,通过lucene与heritrix,设计了专门针对视频信息的垂直搜索引擎,使用BKDRHash算法,实现了对视频信息的针对性搜索. 搜索时将网页抓取、内容筛选和建立索引的过程结合在一起,大大减少了系统的开销,改变了以往传统搜索引擎网页全文收录的做法,筛选了无用信息,对页面信息的提取,以及播放链接的提取过程具有一定的创新性.  相似文献   

11.
机器阅读理解是自然语言处理领域中的一项重要研究任务,高考阅读理解自动答题是近年来阅读理解任务中的又一挑战。目前高考语文阅读理解任务中真题和模拟题的数量相对较少,基于深度学习的方法受到实验数据规模较小的限制,所得的实验结果相比传统方法无明显优势。基于此,该文探索了面向高考语文阅读理解的数据增强方法,结合传统的EDA数据增强思路提出了适应于高考阅读理解的EDA策略,针对阅读材料普遍较长的特征提出了基于滑动窗口的材料动态裁剪方式,围绕材料中不同句子的重要性差异明显的问题,提出了基于相似度计算的材料句质量评价方法。实验结果表明,三种方法均能提升高考题阅读理解自动答题的效果,答题准确率最高可提升5个百分点以上。  相似文献   

12.
基于网络的中文问答系统及信息抽取算法研究   总被引:24,自引:3,他引:21  
问答系统(Question Answering System)能用准确、简洁的答案回答用户用自然语言提出的问题。目前多数问答系统利用大规模文本作为抽取答案的知识库,而网络上丰富的资源为问答系统提供了另外一种良好的知识来源,对于回答简短、基于事实的问题非常有效。本文对基于网络的问答系统研究现状作了简要的介绍,分析了网络信息的特点。我们提出了一种基于语句相似度计算的答案抽取方法,在此基础上实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源,从而节省了下载、分析网络源文本的时间。实验结果表明该系统对人名、数量及时间类型的问题效果显著,对测试问题集的MRR值达到0.51。  相似文献   

13.
在高考结束以后.考生和家长面临着高等院校和专业的选择。如果计算机系统能够辅助做出一个相对适合的志愿填报.将大大增加考生被理想大学录取的机会。结合知网设计志愿填报辅助系统,实现更为科学的中文匹配,让考生轻松地找到想就读的学校与专业。通过用2009~2013年高考数据进行实验,表明系统能让考生能够更有把握地报上自己希望就读的学校与专业。  相似文献   

14.
We present an evolutionary approach for the computation of exact answers to natural languages (NL) questions. Answers are extracted directly from the N-best snippets, which have been identified by a standard Web search engine using NL questions. The core idea of our evolutionary approach to Web question answering is to search for those substrings in the snippets whose contexts are most similar to contexts of already known answers. This context model together with the words mentioned in the NL question are used to evaluate the fitness of answer candidates, which are actually randomly selected substrings from randomly selected sentences of the snippets. New answer candidates are then created by applying specialized operators for crossover and mutation, which either stretch and shrink the substring of an answer candidate or transpose the span to new sentences. Since we have no predefined notion of patterns, our context alignment methods are very dynamic and strictly data-driven. We assessed our system with seven different datasets of question/answer pairs. The results show that this approach is promising, especially when it deals with specific questions.  相似文献   

15.
在高考语文阅读理解中,观点类问题中的观点表达较为抽象,为了从阅读材料中获取与问题相关的答案信息,需要对问题中的抽象词语进行扩展,达到扩展观点类问题的目的。该文提出了基于多任务层级长短时记忆网络(Multi-HLSTM)的问题扩展建模方法。首先将阅读材料与问题进行交互注意,同时建模问题预测和答案预测两个任务,使模型对问题进一步扩展。最后将扩展后的问题与原问题同时应用于问题的答案候选句抽取中。通过在高考语文观点类的真题、模拟题以及DuReader的描述观点类数据集上进行实验,验证了本文的问题扩展模型对答案候选句的抽取性能具有一定的提升作用。  相似文献   

16.
文章设计并实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源,从而节省了下载、分析网络源文本的时间,提出了一种针对该系统的信息抽取算法,并采用一种基于语句相似度计算的答案抽取算法并且进行了改进。实验结果表明该系统对人名及时间类型的问题效果显著。对测试问题集的MRR值达到0.47。  相似文献   

17.
基于语义扩展的短问题分类   总被引:1,自引:0,他引:1  
问题分类是问答系统任务之一。特别是语音交互方式中,用户的提问较短,具有口语化特征,利用传统文本分类方法对问题进行分类的效果不佳。为此提出一种基于语义扩展的短问题分类方法,该方法使用搜索引擎对问题进行知识扩展;然后,使用主题模型进行特征词选择;最后,利用词语相似度计算获取问题的类别。实验结果表明,所提方法在1365条真实问题集上平均F-measure值达到0.713,其值高于支持向量机(SVM)、K近邻(KNN)算法和最大熵方法。因此,该方法在问答系统中可以帮助系统提升问题分类的准确率。  相似文献   

18.
儿童健康及疾病诊疗是家庭及社会聚焦的热点,提供准确、有效的信息咨询也是家长和社会的迫切需求。该文以中文医学知识图谱和医学文本为数据来源,以儿科疾病和保健知识为切入点,对多知识来源的自动问答系统进行了研究。系统采用AC自动机(Aho-Corasick automaton)和正则表达式,融合句法结构及关键词特征,对用户输入问题与模板进行匹配,根据模板生成对应的Cypher语句对儿科医学知识图谱及医学文本进行查询和检索,并生成备选答案。采用融合数据来源权威性及匹配度的评分机制对产生的备选答案进行评分,根据评分向用户返回最终答案。系统在某三甲医院投入试用一个月后,根据用户评分反馈,满意度为85.43%。  相似文献   

19.
一种基于形式概念分析的问答系统答案抽取的研究   总被引:3,自引:0,他引:3  
为了在问答系统中尝试回答更加复杂的问题,有必要存在一种原理性的方法来动态产生不同的问答策略。提出在问答系统中使用形式概念分析(FCA)来抽取答案。在抽取过程中,首先在常问问题集(FAQs)中寻找已经存在的问题,如果在FAQs中的答案不满足用户的需求,再通过搜索引擎获取相关的文档。接着利用这些文档中前N个文档构建概念格,进而采用概念匹配在格中抽取答案。对于不同的问题,使用不同的策略进行匹配和抽取答案。  相似文献   

20.
自动问答系统问句相似度计算的准确率直接影响系统返回答案的准确率,对此提出一种基于Word2vec和句法规则的问句相似度计算方法。构造Text-CNN问句分类模型将问句进行分类,再构造Word2vec词向量模型将问句中词与词的空间向量相似度转换成语义相似度,并加入句法规则的分析。随机从搜狗公开问答数据集中抽取200条数据进行测试,结果表明,该方法与TF-IDF方法相比,自动问答系统返回答案的准确率和召回率分别提高了0.259和0.154。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号