首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
陈兰  金远平 《计算机应用与软件》2009,26(11):129-130,140
随着网络的飞速发展,人们对互联网信息检索的需求不断专业化、细致化,通用搜索引擎技术在一定程度上已经不能满足用户的搜索需求。与此同时,本体相关的技术在信息检索系统的研究越来越成熟。在本体相关技术的基础上,提出一种可以提高搜索效率的垂直搜索引擎构架,并着重对构架中的关键技术及其实现进行了研究。  相似文献   

2.
分析了当前网上搜索引擎的现状及存在的问题,提出了一种结合本体的垂直搜索引擎构建思想,并阐述了垂直搜索引擎构建的关键技术,最后设计实现了一个以电子杂志为主题的垂直搜索引擎原型.  相似文献   

3.
张敏 《软件导刊》2010,(2):13-15
分析了当前网上搜索引擎的现状及存在的问题,提出了一种结合本体的垂直搜索引擎构建思想,构建了基于本体的垂直搜索引擎模型。  相似文献   

4.
企业的运营分析层把正确的信息、在正确的时机提供给相应的决策层,以及决策层及时准确地获得必要的决策参考信息等问题,将成为一个紧迫而复杂的课题。基于需求的驱动,一种基于企业深度挖掘型垂直搜索引擎的出现,利用元数据的管理给数据服务带来了新的解决方案。探讨了用深度挖掘型垂直搜索引擎方法快速、准确地得到需要的信息。  相似文献   

5.
为了改善基于关键词的垂直搜索引擎查全率低和相关排序效果不佳的缺点,提出了基于本体的垂直搜索引擎分类索引模型.设计了一种基于领域本体的分类体系,实现了基于该分类体系的细粒度文本分类,并将分类信息写入索引,增加了索引的语义信息.在lucene原有索引结构的基础上,重新设计了索引的逻辑结构和物理结构,使类别信息和关键词信息合理融合,形成分类索引.最后提出针对该索引的检索算法,并举例验证了该模型的有效性.  相似文献   

6.
基于文本挖掘的本体自动构建系统架构解析   总被引:1,自引:1,他引:1  
本体可以为人与计算机之间的沟通和交流提供语义支撑,在人工智能、知识工程等众多领域有着广泛的应用空间,但现阶段本体主要采用人工构建方法,投入资源大、建设周期长,且质量无法保障,这些成为制约本体应用的主要瓶颈.文中提出了一种基于文本挖掘的本体自动构建系统和方法,详细介绍了用户层、系统工具层和数据资源层中各模块的功能和实现方法,具体分析了系统数据处理的整个流程.该系统和方法对于解决本体构建问题具有借鉴意义.  相似文献   

7.
基于本体的Web文本挖掘与信息检索   总被引:1,自引:0,他引:1       下载免费PDF全文
艾伟  孙四明  张峰 《计算机工程》2010,36(22):75-77
针对传统Web文本挖掘技术缺少语义理解能力的不足,提出并实现一种基于本体的Web文本挖掘模型,即利用基于本体概念体系的向量空间模型替代传统的向量空间模型来表示文档,在此基础上进行Web文本挖掘,并给出一种集成语义信息检索的设计。实验结果初步验证了本体模型在Web文本挖掘技术上应用的可行性。  相似文献   

8.
针对目前全文搜索引擎中存在的查准率较低、不能充分满足专业用户对搜索引擎的搜索需求的问题,设计一种基于元搜索技术的垂直搜索引擎系统结构。利用关联规则挖掘用户关注度较高的信息,提取这些信息中与关键词相关的隐形关键词,并用于扩展搜索。设计基于多关键词组搜索的改进的元搜索引擎位置排序算法。实验结果表明,与以前搜索引擎系统相比,该系统的专业相关度有了一定提高。  相似文献   

9.
李占波  廖继东  李华 《微计算机信息》2007,23(24):194-195,165
36 网络信息资源的“爆炸”式增长使得人们获得有用信息日益困难,垂直搜索引擎应运而生。本文主要研究了下一代的搜索引擎-垂直搜索引擎,并利用Dotlucene建造一个中等规模的垂直搜索引擎,其关键字的拆分比对技术、信息检索的速度以及最终结果的排序都有独到之处.同时给出了部分核心算法。  相似文献   

10.
基于本体论的文本挖掘技术综述   总被引:6,自引:0,他引:6  
贾焰  王永恒  杨树强 《计算机应用》2006,26(9):2013-2015
文本挖掘技术是从海量文本信息中获取潜在有用知识的有效途径。传统的文本挖掘方法由于不能有效运用语义信息而难以达到更高的准确度。本体论为语义信息的合理表示和有效组织提供了理论支持和技术手段。介绍和分析了常识本体和领域本体以及基于这些本体的文本挖掘方法。  相似文献   

11.
朱卫星  徐伟光  何红悦  李雯 《计算机科学》2017,44(Z11):411-413, 456
文本数据是存储和交换信息最自然的方式,文本挖掘技术可以发现海量文本数据中隐藏的潜在知识模式。研究了文本数据主题挖掘与关联搜索技术,首先通过文本解析提取、分词预处理和索引等进行文本信息处理,然后利用基于潜在语义关系的主题发现模型挖掘大量文本数据中隐藏的主题信息,最后利用主题模型计算关键词间的关联程度进行查询扩展,从而实现关联搜索。实现了一个文本数据挖掘与关联搜索的原型系统,对Tancorp数据集进行主题发现和关联搜索,并以视化和网页同步显示关联搜索的过程。  相似文献   

12.
段磊  李琦  毛曦 《计算机科学》2009,36(2):172-174
提出了一种智能空间搜索引擎的解决方案.通过分析传统搜索引擎在处理空间语义方面的缺陷,将本体和自然语言处理技术引入搜索引擎中,解决基于自然语言查询的空间检索问题.初步构造了基于本体的空间搜索引擎的结构框架,分析了本体在空间搜索引擎中的应用范畴,并构建了相应的本体库以及解析自然语言查询的模式库,提出了自然语言式空间查询的解析方案.最后通过建立空间搜索引擎原型系统证明了该方案的可行性.  相似文献   

13.
随着网络技术的快速发展,通用搜索引擎已经不能满足用户的一些需求,特别是当用户需要搜索某一领域内的信息时,垂直搜索引擎就正好符合这种需求。以手机资源为背景,通过运用扩展Heritrix和Lucene,构建了一个检索结果比较精准的垂直搜索引擎。研究了通过定制和扩展Heritrix从互联网上爬取相关的信息资源,利用HtmlParser工具对爬取的信息进行分析和抽取,运用Lucene建立全文索引和提供检索服务,并设计了MVC的查询接口。通过响应时间、查全率和查准率的测试实验表明,系统达到了设计目标。  相似文献   

14.
随着Internet和web技术的飞速发展,Internet已成为人们进行信息交流的不可缺少的巨大的信息空间。面对如此巨大的海量信息,人们在寻找自己所需的信息时常常迷失方向。如何快速、准确的从浩瀚的信息资源中找到自己所需的信息已成为困扰用户的一大难题。垂直搜索引擎是目前web搜索领域最受人关注的研究热点。而我校位于三峡库区,农业是我校的主打专业,针对我国提出的“科技兴农”和可持续发展精神,本文从概念和技术两个方面介绍了垂直搜索引擎的工作流程和关键技术,并且研究了将垂直搜素技术和三农问题结合起来,解决库区农村、农民和农业信息闭塞、观念落后的现状,实现农业生产信息化。  相似文献   

15.
一种新型网络信息采集器的研究   总被引:2,自引:0,他引:2  
为了克服内容评价搜索策略算法"近视"和链接分析算法"主体偏移"的缺点,提出了一种使用内容评价搜索策略和链接分析策略结合的算法.使用的方法开发网络信息采集器能够极大地提高用户的检索速度,并能有效地限制检索领域,大大减小检索结果的信息冗余度,使用户能够快速获取其真正需要的信息.研究表明使用内容评价搜索策略和链接分析策略结合的算法开发网络信息采集器能够提高垂直搜索引擎快、精、准等方面的性能.  相似文献   

16.
张柳松 《微计算机信息》2007,23(33):237-238,230
由于传统的搜索引擎是基于关键词的检索,检索结果无论是在召回率还是在精确度上都不能令人满意,然而基于本体的智能检索系统是以概念语义为核心来实现信息检索,能改善传统的搜索引擎在语义理解方面的不足。  相似文献   

17.
数据挖掘方法本体研究   总被引:5,自引:0,他引:5  
数据挖掘是包含多个阶段的知识发现过程。一个简单、但典型的数据挖掘过程可能包括数据预处理阶段,数据挖掘算法的应用阶段,以及对挖掘结果的可视化处理阶段。在每个阶段,都会有多个算法或方法供数据挖掘工作者选择,但仅有一些算法和方法组合是有效的。即使是数据挖掘领域的专家,也可能会忽略一些重要的、有助于知识发现的数据挖掘算法或方法。本文中,我们将讨论使用本体的方法来协助数据挖掘工作者在实施数据挖掘过程中对众多可供选择的算法和方法进行选择。  相似文献   

18.
提出了概念-权向量组匹配算法。该算法对输入信息和待评估Ontology进行语义分析,生成对应的概念.权向量组,利用概念.权向量组的匹配结果生成作为过滤和排序依据的结果向量。并利用该算法开发了Ontology搜索引擎——Wl OntoSearch。  相似文献   

19.
Web数据挖掘是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域.本文论述了Web数据挖掘的发展现状、发展趋势以及将来可能的研究方向,并简单介绍了个性化搜索引擎的一些情况,最后论述了Web数据挖掘在个性化搜索引擎中的应用.  相似文献   

20.
随着企业的发展以及企业信息化建设的推进,Internet技术在越来越多的企业中得到应用,企业内部信息量以惊人的速度增长.面对企业内部海量信息,传统的搜索引擎无法满足企业用户对企业信息的检索需求,因此企业级的搜索引擎成为迫切需求.对传统的搜索引擎和本体知识进行学习,设计了一个基于本体的企业级搜索引擎系统模型.该设计运用本体知识,对检索关键词进行语义扩展,对检索结果进行语义相似性判断,最终实现搜索结果更加精确.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号