首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
一个应用模糊方法的智能搜索引擎的构建   总被引:14,自引:3,他引:11  
罗三定  黄勇 《计算机工程》2000,26(12):113-115
旨在建立一种新型的搜索引擎,它利用模糊的方法,动态收集和使用人工的智能,并在用户的搜索过程中不断地自我学习,以一种人类的方式积累经验和知识,从而同时提高搜索引擎的查准率和查全率。  相似文献   

2.
基于概念的文档评价模型   总被引:3,自引:0,他引:3  
理解文档的内容和查询的真实意图是提高搜索引擎智能水平的一种有效途径。提出了一种以分析概念及其关系为基础来理解文档、揣摩查询意图的模型。在该模型中,结合用户背景知识构造一个用户概念库,将文档及查询要求转化为概念集,并适当扩充查询要求概念集,最后将两概念集转化为特征向量,计算其相似度,作为文档的评价值。文中详细给出了概念库及必需的概念运算的数学模型。  相似文献   

3.
为研究网络教育资源搜索工具的智能化,并为学生提供个性化信息服务的智能代理系统,以当前网络教育资源环境为背景,基于"概念网"和"智能搜索代理"技术,提出面向网络教育的个性化智能代理搜索引擎的设计和实现方法.该引擎可以实现关键词在概念方面的检索,比传统搜索引擎的检索精度和效率更高.  相似文献   

4.
基于Swoogle 的本体映射关键步骤在于通过本体搜索引擎动态的获取多个背景本体。然而,目前该步骤却存在无法找到与某些概念相关联的背景本体,以及由于词义的模糊性搜集了错误的背景本体的问题。针对第一个问题,提出利用基于虚拟文档的映射技术,提取在WordNet 中与概念同义的同义词,把原先的对单个概念进行搜索转换成对同义概念集进行搜索,进而提高本体搜索面,获取更多背景本体;针对第二个问题,提出基于语义环境的动态本体映射的新映射方法,采用该方法来排除错误背景本体,使本体收集更加精确。实验显示改进后的方法有效的提  相似文献   

5.
针对当前《知网》的词语语义描述与人们对词汇的主观认知之间存在诸多不匹配的问题,在充分利用丰富的网络知识的背景下,提出了一种融合《知网》和搜索引擎的词汇语义相似度计算方法。首先,考虑了词语与词语义原之间的包含关系,利用改进的概念相似度计算方法得到初步的词语语义相似度结果;然后,利用基于搜索引擎的相关性双重检测算法和点互信息法得出进一步的语义相似度结果;最后,设计了拟合函数并利用批量梯度下降法学习权值参数,融合前两步的相似度计算结果。实验结果表明,与单纯的基于《知网》和基于搜索引擎的改进方法相比,融合方法的斯皮尔曼系数和皮尔逊系数均提升了5%,同时提升了具体词语义描述与人们对词汇的主观认知之间的匹配度,验证了将网络知识背景融入到概念相似度计算方法中能有效提高中文词汇语义相似度的计算性能。  相似文献   

6.
为提高搜索引擎的语义处理能力,以旅游领域为背景,利用领域本体对知识的表示和推理能力,提出一种领域本体中基于概念格的相关度计算模型。根据该模型设计用户检索项推荐技术并予以实现。实验结果表明,相关度计算模型能充分利用本体中概念的语义信息以及实例之间的关系,得到的结果较合理。  相似文献   

7.
对现有的搜索引擎技术进行了详细比较分析,并提出了用于特定领域如电子商务智能搜索引擎技术的研究思路。采用知识库等人工智能新技术来设计搜索引擎,从而实现将搜索的信息转化为有用的知识,提高搜索技术的智能水平,并实现推送Push技术,为电子商务提供服务。  相似文献   

8.
沈玺  王永成 《计算机仿真》2006,23(2):222-226
使用语音识别技术为搜索引擎提供语音查询接口,使得奇询概念的输入更为简便。但是,由于查询概念中存在大量的专有名词和名称,识别精度往往不高,影响搜索结果的准确率。该文提出一种在新闻领域内,利用新闻领域知识提高查询概念识别率的方法,通过计算语音识别结果与新闻概念库中概念的语音相似度确定备选结果,计算备选结果与辅助概念的新闻相关度来确定最终的查询概念。实验证明,该方法对新闻搜索引擎的查询概念的纠错收到了良好的效果。  相似文献   

9.
中文搜索引擎概念检索初探   总被引:19,自引:1,他引:18  
搜索引擎传统的关键词匹配检索模式存在很多问题,概念检索是解决这些问题的关键技术之一。该文简要介绍了概念检索的主要内容,针对中文搜索引擎,探索出了一种基于概念语义网络知识库的概念检索模型。在此基础上,针对计算机这一特定领域,创建了一个含有500多个概念节点,包括概念层次关系和近300种概念相关关系的语义网络,初步实现了计算机领域文档的概念检索。实验结果表明,该模型对于提高中文搜索引擎的智能水平是非常有效的。  相似文献   

10.
基于知识树的领域知识组织和应用*   总被引:1,自引:0,他引:1  
在分析已有知识表示方法优缺点的基础上,提出一种高效的知识表达模型——概念知识树。概念知识树模型不仅结构性好、表达能力强,而且在应用中具有良好的适应性和延展性,现主要应用于信息检索和自然语言理解领域。以旅游领域为背景,用概念知识树作为表达模型建立相应的领域知识体系,并在此基础之上实现了一个旅游智能分析系统。该系统可在对用户需求(自然语言)进行一定程度语义理解的基础上,根据所建立的知识体系自动进行语义匹配,最终返回满足用户需要以及相关的旅游路线信息。  相似文献   

11.
We present a new next generation domain search engine called MedicoPort. MedicoPort is a medical search engine designed for the users with no medical expertise. It is enhanced with the domain knowledge obtained from Unified Medical Language System (UMLS) to increase the effectiveness of the searches. The power of the system is based on the ability to understand the semantics of web pages and the user queries. MedicoPort transforms a keyword search into a conceptual search. Through our system we present a topical web crawling technique and indexing techniques empowered by the semantics information. MedicoPort aims to generate maximum output with semantic value using minimum input from the user. Since MedicoPort is designed to help people seeking information about health on the web, our target users are not medical specialists who can effectively use the special jargon of medicine and access medical databases. Medical experts have the advantage of shrinking the answer set by expressing several terms using medical terminology. MedicoPort provides the same advantage to its users through the automated use of the medical domain knowledge in the background. The results of our experiments indicate that, expanding the queries with domain knowledge, such as using the synonyms and partially or contextually relevant terms from UMLS, increase dramatically the relevance of an answer set produced by MedicoPort and the number of retrieved web pages that are relevant to the user request.  相似文献   

12.
Web数据挖掘是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域.本文论述了Web数据挖掘的发展现状、发展趋势以及将来可能的研究方向,并简单介绍了个性化搜索引擎的一些情况,最后论述了Web数据挖掘在个性化搜索引擎中的应用.  相似文献   

13.
具有概念联想功能的特定领域分词词典的自动构建   总被引:3,自引:0,他引:3  
张彦  邵志清 《计算机工程》2004,30(20):148-150
提出了一种基于PAT树型结构的高频字串提取的改进算法。并以此用来获得特定领域网页中的未登录词集合,利用基于语义距离的概念相似度计算公式来获得任一概念的相关概念,从而给出了用于特定领域搜索引擎的语义词典完整的自动构建方法。将生成的语义词典用于搜索引擎FlyingScnder中。实验结果证明新的词典比原有的手工构建的词典分词效果要理想得多。而且提供了概念联想的功能。  相似文献   

14.
传统的基于网页方式的搜索引擎服务不能很好地满足用户个性化的需求,搜索引擎Web API概念的提出较好地解决了这一问题。文中讨论了非商业网站如何使用搜索引擎Web APIs实现网站搜索服务。为避免搜索引擎Web APIs在搜索次数上的限制,给出一种不使用Search APIs而直接通过模拟请求方式得到搜索结果的新方法。  相似文献   

15.
中文交互式网络搜索引擎及其自学习能力   总被引:8,自引:1,他引:8  
论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于自动机思想分词是INSE提出的新概念,应用于中文分词可以满足最大匹配且速度较快。INSE自学习能力的实现依靠神经网络的BP算法。该算法应用于交互式网络搜索引擎可以提供更加精确的查询结果。  相似文献   

16.
We describe a new approach to the application of stochastic search in Inductive Logic Programming (ILP). Unlike traditional approaches we do not focus directly on evolving logical concepts but our refinement-based approach uses the stochastic optimization process to iteratively adapt the initial working concept. Utilization of context-sensitive concept refinements (adaptations) helps the search operations to produce mostly syntactically correct concepts. It also enables using available background knowledge both for efficiently restricting the search space and for directing the search. Thereby, the search is more flexible, less problem-specific and the framework can be easily used with any stochastic search algorithm within ILP domain. Experimental results on several data sets verify the usefulness of this approach.  相似文献   

17.
本体采用基于语法词汇的表述方式,使本体自身表示可能存在模糊性、错误理解等问题,部分本体的概念可以通过自身的上下文信息推测出其含义,但是有些本体根据已有信息不能清晰表达其概念的确切含义.针对这个问题,提出基于背景知识的本体注释方法,对本体本身进行注释和澄清.包括基于WordNet和Web搜索引擎的注释方法,利用WordNet查找本体概念的正确词义,利用Web搜索引擎搜索本体概念的snippets,分别将词义和snippets作为其属性注释到本体中.实验表明本体注释率达到99.12%,表明本文方法的是可行的,本体注释正确率达到80.76%,比同类方法更高.  相似文献   

18.
网络已经成为人们获取知识的一个重要途径。然而面对巨大的Web资源库,用户若想获得所需要信息已不再是一件简单的事情。通用搜索引擎返回大量的无关信息.不能满足用户的特定信息检索需求。针对这个问题,Web信息检索领域出现了一个新的研究方向——主题驱动的Web资源发现。介绍了通用搜索引擎的基本结构、工作原理及现状。阐述了主题Web挖掘的研究背景、任务及目前研究技术的进展,并对其未来的发展方向进行了探讨。对通用搜索引擎和主题Web挖掘的关系进行了分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号