首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于字表的中文搜索引擎分词系统的设计与实现   总被引:9,自引:0,他引:9  
丁承  邵志清 《计算机工程》2001,27(2):191-192,F003
分析了常用的基于词典的汉语分词方法用于中文搜索引擎开发中的不足,提出基于字表的中文搜索引擎分词系统,并在索引,查询,排除歧义等方面进行了设计和实现。  相似文献   

2.
本文提出了一个基于因特网的中文搜索引擎模型,并从数据组织结构、搜索策略及实现算法等方面进行了论述。  相似文献   

3.
由于互联网上异构数据的爆炸性增长,目前依靠关键词技术的垂直搜索引擎遇到发展的瓶颈。本文引入本体论及相关技术,构建基于本体的垂直搜索引擎系统模型。模型中对抓取的异构信息进行本体化描述,在此基础上进行概念相似度计算,实现语义相关的本体查询,大大改善了目前垂直搜索引擎的查全率与查准率。  相似文献   

4.
汉语自动分词是汉语信息处理的前提,词典是汉语自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率。详细介绍汉语自动分词的三种方法及五种词典机制,提出一种简洁而有效的中文分词词典机制,并通过理论分析和实验对比说明几种词典机制的效率差异来证明所提出分词词典机制的有效性。  相似文献   

5.
无法很好地适应网络环境的变化,不能对网络中出现的问题做出及时的反应,这是当前的元搜索引擎普遍存在的问题.这一问题的解决,必然大大提高元搜索引擎的检索效率和精度.提出了一种基于Agent的元搜索引擎的模型IMSA,由检索Agent、管理Agent和学习Agent组成.该模型的成员搜索引擎的调度策略采用动态学习和静态学习相结合的方法实现.在静态学习中,得到该成员搜索引擎的信任因子的初始值,并且针对用户的访问情况,给出了信任因子的计算方法.综合考虑成员搜索引擎的对检索结果的评价以及查询关键词与结果摘要的相关度等各方面的因素,给出了该模型的结果合成策略.  相似文献   

6.
网络上的专业搜索引擎数量众多,普通用户在选择时往往无所适从。文章提出了一个自动的查询导向系统,可以将用户查询自动导向到合适的专业搜索引擎,解决了这个矛盾。  相似文献   

7.
搜索引擎技术的新发展—多元搜索引擎系统   总被引:21,自引:0,他引:21  
在分析传统搜索引擎技术所存在不足的基础上,介绍了搜索引擎发展过程中出现的一种新技术-多元搜索引擎,深入分析了多元搜索引擎系统的组成结构。详细地考察了多元搜索引擎的发展状况,并对多元搜索引擎的系统指标进行了完整的评价。  相似文献   

8.
针对目前大部分搜索引擎不能精确识别使用不同查询词而期望获得不同查询结果的情况,该文提出一种基于用户行为模型的搜索引擎的思想,论述其原型系统SEB实现过程和关键技术,其中的行为模型结合人类行为学相关理论对用户访问行为进行分类和表示,对搜索结果进行了处理,实现了个性化搜索。实验表明,经SEB原型系统处理的搜索结果更加符合用户需求。  相似文献   

9.
一种中文分词词典新机制——四字哈希机制   总被引:9,自引:0,他引:9  
词典是中文自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率。本文首先分析了分词词典在中文信息处理中的作用和已有的三种典型的词典机制,并在此基础上根据中文词语中双字词语较多,并且三字词、四字成语也较多这一特点提出了一种新的分词词典机制-四字哈希机制,充分发挥了现代计算机内存大空间的优势,提高了分词的速度和效率。  相似文献   

10.
一个无需词典支持和切词处理的中文文档分类系统   总被引:12,自引:0,他引:12  
报道了一个无需词典支持和切词处理的中文文档分类系统。其特点是利用N-gram信息进行中文文档分类,使中文文档分类摆脱了对词典和切词处理的依赖,实现了中文文档分类的领域无关性和时间无关性;采用开放的体系结构使文档分类系统易于功能扩充和性能完善。测试结果表明该系统具有令人满意的分类性能。  相似文献   

11.
硬件设计搜索引擎的信息描述体设计   总被引:2,自引:0,他引:2  
从因特网上获取信息或资源需要使用搜索引擎,可是目前的通用搜索引擎并不能搜索出使用专业工具设计的各种硬件格式的文件,即硬件部件设计。本文研究一种新的针对硬件部件设计的专用搜索引擎,使用该引擎可根据因特网上基于硬件部件设计特性的分类信息,搜索到硬件部件设计文件,从而为硬件开发者缩短开发周期提供较好的支持。本文给出了该搜索引擎的设计方案。  相似文献   

12.
基于本体的元搜索引擎结果排序算法研究   总被引:1,自引:1,他引:1  
介绍了本体及元搜索引擎技术,认为将本体概念引入到元搜索引擎系统中,能够实现基于同义词、近义词的查询.给出了一个基于本体的元搜索引擎系统体系结构,介绍了系统的工作原理,提出了一种改进的摘要排序算法,并重点介绍了该算法的实现.  相似文献   

13.
Web 2.0的出现使网络中的信息量呈井喷局势,给搜索引擎带来了新的挑战,目前的搜索引擎已经不能满足大多数用户的需求。针对这种情况,首先分析了当前搜索引擎的现状和优缺点,其次针对新的情况下的用户需求作出分析,参考和利用了当前Web 2.0的一些先进技术,提出一个基于Web 2.0社区的综合搜索引擎。  相似文献   

14.
Web搜索引擎框架研究   总被引:42,自引:1,他引:42  
Web搜索引擎是Internet上非常有用的信息检索工具,但是由于目前搜索引擎检索出的信息量庞大,且一个特定的搜索引擎主要包含某一特定领域的信息,这使得用户很难从某一个搜索引擎获得准确的导航信息。文中提出一个新的Web搜索引擎框架GSE,并提出了一个适合于Web信息获取与处理的语言WERPL。通过WIRPL可以将多个Web搜索引擎结合起来,为用户提供一个一致、高效、准确的Web搜索引擎。  相似文献   

15.
基于Web的搜索引擎及其在化学信息资源导航中的应用   总被引:5,自引:3,他引:5  
网络信息检索工具是Internet信息资源快速定位的重要方法。文章中结合建立Internet化学信息资源导航系统ChIN网一文检索系统的要求,讨论了全文检索的产生、现状和发展趋势。在对信息搜索机制和主要全文检索软件的分析比较的基础上,采用全文检索软件Isearch开发了ChIN网页的全文检索系统。同时给出了ChIN网页全文检索系统的应用实例。  相似文献   

16.
智能化搜索引擎技术的研究进展   总被引:12,自引:0,他引:12  
阐述了传统信息获取的几种模型,分析比较它们之间的优劣,归纳总结了信息获取模型的层次框架.对智能化信息获取技术的研究进展和概况进行综述,并给出了若干值得研究的问题及相应的关键技术.  相似文献   

17.
搜索引擎的目的在于快速有效地找到用户需求的信息,在黄页搜索引擎中,通过关键字搜索,可以返回大量的信息,但其中的大部分信息不在用户需求的范围内.二次检索的定义是,在一次检索结果的基础上,按照特定的条件进行筛选,获得更为满足用户需求的结果.显然,二次检索在黄页搜索中的应用是必要的.基于这样的需求,提出了一种使用内存数据库和黄页搜索引擎联合进行二次搜索的方法.  相似文献   

18.
对HITS(Hyperlink-Induced Topic Search)算法进行研究,克服其主体漂移和扩大化等缺点,改进并提出建立一个新的基于链接分析的Web检索结果的相关度排序方法,并把它应用到一个专题搜索引擎中.  相似文献   

19.
RL_Spider:一种自主垂直搜索引擎网络爬虫   总被引:1,自引:0,他引:1  
在分析相关spider技术的基础上,提出了将强化学习技术应用到垂直搜索引擎的可控网络爬虫方法。该方法通过强化学习技术得到一些控制经验信息,根据这些信息来预测较远的回报,按照某一主题进行搜索,以使累积返回的回报值最大。将得到的网页存储、索引,用户通过搜索引擎的搜索接口,就可以得到最佳的搜索结果。对多个网站进行主题爬虫搜索,实验结果表明,该方法对于网络的查全率和查准率都具有较大的提高。  相似文献   

20.
本文提出了一种Intgernet信息监控系统的构想,它采用了基于神经网络分类的搜索引擎技术,能大大提高信息监察部门的工作效率,其他用户也可将其用作智能化信息检索工具。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号