共查询到20条相似文献,搜索用时 15 毫秒
1.
分析了当前网上搜索引擎的现状及存在的问题,提出了一种结合本体的垂直搜索引擎构建思想,并阐述了垂直搜索引擎构建的关键技术,最后设计实现了一个以电子杂志为主题的垂直搜索引擎原型. 相似文献
2.
针对垂直搜索引擎研究领域的关键技术问题,提出了一个结合本体筛选和文本挖掘的垂直搜索引擎构建思想.首先探讨了作为研究基础的本体和文本挖掘技术,讨论了两者的作用;之后阐述了垂直搜索引擎构建的关键技术,包括基于本体筛选的智能搜索器、结合文本挖掘的网页信息分析及抽取、索引器及查询处理器的构造;最后,对提出的思想进行了实现验证,构造一个面向高校毕业生招聘的垂直搜索引擎原型. 相似文献
3.
由于互联网上异构数据的爆炸性增长,目前依靠关键词技术的垂直搜索引擎遇到发展的瓶颈。本文引入本体论及相关技术,构建基于本体的垂直搜索引擎系统模型。模型中对抓取的异构信息进行本体化描述,在此基础上进行概念相似度计算,实现语义相关的本体查询,大大改善了目前垂直搜索引擎的查全率与查准率。 相似文献
4.
《计算机应用与软件》2014,(8)
农业领域本体的构建将为农业垂直搜索引擎提供知识组织基础。在对本体构建技术进行深入研究的基础上,设计实现基于文献的农业领域本体构建方法。使用Web数据抽取技术获取农业文献,通过对文献分词和清洗,自动提取领域概念,并用关联分析和改进的层次聚类发现领域概念间关系,构建农业领域本体。通过实验验证,该方法提高了领域概念间关系聚类效果和领域本体构建效果。最后加以应用实施,实现了基于本体的农业垂直搜索引擎。 相似文献
5.
传统的主题搜索技术难以适应大范围垂直领域的智能搜索需求,通过将主题搜索与语义搜索相关技术分别应用到搜索引擎的数据采集与智能查询过程中,利用基于层次分类模型的领域数据采集机器人,完成对领域信息的精准采集,基于中文百科资源自动构建领域本体,将大规模领域本体库用于搜索引擎的语义扩展推理中,实现了一个面向领域的智能搜索引擎。实验结果表明,基于层次结构的领域分类具有较高的分类准确率和召回率,与其他搜索引擎相比较,该系统具有领域专业性强、领域易于移植、检索更加智能等特点。 相似文献
6.
7.
8.
9.
随着网络的飞速发展,人们对互联网信息检索的需求不断专业化、细致化,通用搜索引擎技术在一定程度上已经不能满足用户的搜索需求。与此同时,本体相关的技术在信息检索系统的研究越来越成熟。在本体相关技术的基础上,提出一种可以提高搜索效率的垂直搜索引擎构架,并着重对构架中的关键技术及其实现进行了研究。 相似文献
10.
B2B垂直搜索引擎是垂直搜索引擎在电子商务领域的应用。怎样更好地对互联网中海量的企业产品信息进行抽取和去噪,是当前B2B垂直搜索引擎构建中所面临的重要问题。介绍了B2B垂直搜索引擎的特征;分析了一般企业网站的基本结构,在此基础上提出一种面向B2B垂直搜索引擎的企业站点产品信息去噪方法;给出了该方法的实验结果。使用这种方法抽取到的产品信息可用于指导产品进一步的分类工作。 相似文献
11.
12.
为了改善基于关键词的垂直搜索引擎查全率低和相关排序效果不佳的缺点,提出了基于本体的垂直搜索引擎分类索引模型.设计了一种基于领域本体的分类体系,实现了基于该分类体系的细粒度文本分类,并将分类信息写入索引,增加了索引的语义信息.在lucene原有索引结构的基础上,重新设计了索引的逻辑结构和物理结构,使类别信息和关键词信息合理融合,形成分类索引.最后提出针对该索引的检索算法,并举例验证了该模型的有效性. 相似文献
13.
B2B垂直搜索引擎是垂直搜索引擎在电子商务领域的应用.怎样更好地对互联网中海量的企业产品信息进行抽取和去噪.是当前B2B垂直搜索引擎构建中所面临的重要问题.介绍了B2B垂直搜索引擎的特征;分析了一般企业网站的基本结构,在此基础上提出一种面向B2B垂直搜索引擎的企业站点产品信息去噪方法;给出了该方法的实验结果.使用这种方法抽取到的产品信息可用于指导产品进一步的分类工作. 相似文献
14.
15.
文章针对垂直搜索引擎技术进行了介绍,介绍了通用信息检索技术、信息抽取技术和信息抓取技术,例如Nutch和GATE。并利用当前流行的技术构建了一个垂直搜索引擎,最后描述了系统的架构和实现过程。 相似文献
16.
王梅文 《数字社区&智能家居》2007,2(12):1520-1522
分析了药学本体构建的意义,介绍了药学本体构建工具和构建的原则,使用protégě本体编辑器,并借鉴七步法构建思路,详细阐述了药学本体每一步骤的构建过程,包括药学本体需求分析,复用现有本体的可能性分析,药学领域知识的结构化分析和核心概念集的获取,药学本体类、属性和实例的定义.本文的药学本体已应用在基于本体的中文元搜索引擎查询结果自动分类系统中,并能通过系统的运行实现本体的进化. 相似文献
17.
针对单个网站构建本体库垂直搜索引擎的过程中,叙词及其间逻辑关系等收集整理所耗人力成本高,导致该技术框架虽成熟,而大多网站搜索功能仍以字符匹配为主,缺乏分词、查询扩展及结果的相关度排序,很难准确命中相关查询内容等问题,设计并开发了一套基于网站简约本体库的垂直搜索系统。该系统以中国气象数据网(http://data.cma.cn)为例,利用protégé根据网站的导航目录,构建了中国气象数据网的本体库,基于Lucene引擎构建技术框架,对本体库中的对象及网页内容分别进行分词,并构建本体对象索引库及网页索引库;前端对查询内容分词后,先在本体对象索引库中进行扩展,利用TF-IDF相关度算法计算扩展结果的相关度并排序,该值作为各扩展本体对象的权值,并将各自的权值动态赋给利用Jena二次语义分析技术扩展的对象,最后将所有带有权值的关键词在网页索引库中查询检索,计算结果相关度并排序。实验结果表明,该系统构建简便,能为用户扩展、推荐相关查询内容,提高了针对网站检索的查准率及查全率。 相似文献
18.
本文提出了一个基于多本体的搜索引擎框架,分析了本体、智能代理程序、搜索引擎本身在框架中的作用和工作模式.同时,针对互联网异构本体的查询问题,提出了一个分布式多本体查询的模型.引入本体技术后,web搜索引擎的工作方式由关键词全文检索转为知识检索,从而增强了搜索引擎处理复杂查询的能力. 相似文献
19.
目前互联网上的信息正在飞速的增长,人们主要依靠搜索引擎查找信息,随着专业化不断加强,垂直搜索引擎成为人们新的工具,但构建专业化搜索引擎过程比较复杂.为了解决垂直搜索引擎中主题爬虫配置不灵活的问题,采用在爬虫上集成规则引擎的方法,通过规则库来控制爬虫运行,并且使用可扩展度较高的开源爬虫项目Heritrix和开源规则引擎项目Drools,构建配置方便、灵活度高的个性化爬虫,从而将原先主题爬虫的设置从紧耦合转变成了松耦合,降低了用户配置难度. 相似文献
20.
随着网络迅速发展,Internet上的资源日趋丰富,搜索引擎被网民广泛使用,搜索引擎的发展为垂直搜索引擎的出现提供了良好的市场空间,本文介绍了基于垂直搜索技术的搜索引擎,并探讨了垂直搜索引擎的优势. 相似文献