首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
毕鹏 《计算机科学》2004,31(Z1):35-37
本文讨论了如何从网页点击次数的统计数据中获得用户对网页中包含信息的评价.在考虑了网页内容,时间等因素对信息价值的影响后,给出了一种基于用户评价的对信息检索结果个性化排序的模型.模型根据用户浏览网页时的行为和用户的特征信息,预测用户对信息的需求,智能地对信息检索结果进行个性化的排序.模型实现简单,可以应用于多数信息检索系统,为用户提供个性化的信息服务.  相似文献   

2.
目前信息检索正在向着领域化、智能化方向发展.针对农业领域的分支领域茶虫害为研究对象,通过构建茶虫害领域本体,设计并实现了基于茶虫害本体的智能检索系统.该系统在特定主题的限定下进行信息的搜集和检索,能识别所搜索的网页与主题是否相关,而且能产生智能导航链接在主题最相关的范围内搜索,把信息检索从目前基于关键词层面提升到基于知识的层面,从而能够帮助用户更容易地找到感兴趣的信息,提高信息服务的质量和信息检索的准确率.  相似文献   

3.
本文对网页链接结构以及主题信息检索系统进行分析,将链接分析方法应用到主题信息检索系统,概述了链接分析方法在主题信息检索系统搜索策略和检索结果排序中的应用以及运用链接分析进行主题页面相关度分析的方法和策略,运用链接分析衡量主题页面权重,使用建立链接分析主题词典的方法对主题信息检索系统进行改进以便于提高定向信息搜索采集效率。  相似文献   

4.
针对用户利用常用搜索引擎查询信息时,搜索引擎返回海量杂乱、无序的网页,用户难以从中快速、准确地获得真正关心的信息的现状,从Internet用户的兴趣度出发,设计了一种基于近似网页聚类算法的智能搜索系统。该系统在用户利用常用搜索引擎系统进行信息检索时,消除搜索引擎返回的重复页,对剩余页面进行聚类,返回给用户聚类后的网页簇,这样用户就可以选择浏览自己感兴趣的页面,从而大大提高了信息检索的查准率;实验证明该系统在保证查全率和查准率的基础上大大提高了搜索效率。  相似文献   

5.
随着Web技术的迅速发展,提供个性化服务的搜索引擎技术受到用户的广泛关注,网页排序是其中的关键技术之一。本文利用PageRank算法对原有的Lucene网页排序进行了改进,设计并实现了关于手机信息搜索的个性化搜索引擎。实验结果证明,改进后的排序算法能够较好地提高信息检索的准确度,为用户带来了优于Lucene自身排序的搜索体验。  相似文献   

6.
定题搜索引擎Robot的设计与算法   总被引:6,自引:0,他引:6  
定题搜索引擎将信息检索限定在特定主题领域,提供特定主题的信息检索服务,是新一代搜索引擎的发展方向之一。该文介绍了一个定题搜索robot系统NetBat 2.02版,它可以实现在web上爬行下载主题相关网页。定题搜索的关键技术是主题相关信息的搜索及网页相关度分析。该文分析了传统定题搜索算法的优缺点,提出了基于反向链接结合超链文本分析的定题搜索算法。文章还对基于内容的网页相关度分析算法进行了详细的论述。对比搜索实验表明系统有着较好的性能,能准确地爬行到主题相关网页。  相似文献   

7.
基于遗传算法的定题信息搜索策略   总被引:4,自引:0,他引:4  
定题检索将信息检索限定在特定主题领域,提供主题领域内信息的检索服务。它是新一代搜索引擎的发展方向之一。定题检索的关键技术是主题相关信息的搜索。本文提出了基于遗传算法的定题信息搜索策略,提高链接于内容相似度不高的网页之后的页面被搜索的机会,扩大了相关网页的搜索范围。同时,借助超链Metadata的提示信息预测链接页面的主题相关度,加快了搜索速度。对比搜索试验证明了算法具有较好的性能。  相似文献   

8.
基于近似网页聚类的智能搜索系统   总被引:1,自引:1,他引:1  
从Internet用户的兴趣度出发,设计了一种基于近似网页聚类的智能搜索系统。该系统在用户利用常用搜索引擎系统进行信息检索时,消除搜索引擎返回的重复页,对剩余页面进行聚类,返回给用户聚类后的网页簇,这样用户就可以选择浏览自己感兴趣的页面,从而大大提高了信息检索的查准率;实验证明该系统在保证查全率和查准率的基础上大大提高了搜索效率。  相似文献   

9.
基于Web企业竞争对手情报自动搜集平台   总被引:4,自引:1,他引:4  
从互联网中准确有效及时地自动搜索出需要的信息,是Web信息处理中的一个重要研究课题。本文在所提出的基于搜索路径Web网页搜索和基于多知识网页信息抽取方法基础上,给出基于Web企业竞争对手情报自动收集平台的实现方法,该平台可以有效地从多个企业门户网站中,自动搜索出所需要的目标网页,并能够从目标网页中自动抽取其中多记录信息。本文利用该平台进行了企业人才招聘信息的自动搜索实验。实验结果证实了该平台在信息自动搜集方面的有效性和准确性。  相似文献   

10.
土地利用变化检测一直是遥感影像变化检测研究的重点。在分析已有变化检测方法的基础上提出了一种基于状态转移矩阵(State Transition Matrix,STM)的变化检测方法。以像斑为分析单位,通过样本像斑的选择与更新对变化检测区域进行分析,利用辅助数据生成的地物变化状态转移矩阵对变化检测结果进行修正。实验证明了该方法的有效性。  相似文献   

11.
互联网上大部分的数字化信息都与地球上的地点和位置关联,信息检索查询中大量地包含地理信息,传统的基于关键字匹配方法没有考虑检索中的空间关系,无法满足此类检索需求。地理信息检索根据地理范围从文档中获取空间语义匹配的地理知识文档,成为国内外信息检索和GIS领域的热点研究方向。提出了一个地理信息检索的基本系统框架,依据该框架对地理信息知识库、地理信息抽取、地理信息检索模型、混合索引和检索可视化等关键性技术进行了分类概括总结。在对已有技术进行深入对比分析的基础上,指出了该领域未来的研究工作和面临的挑战,并提供了大量的参考文献。  相似文献   

12.
Nowadays, spatial and temporal data play an important role in social networks. These data are distributed and dispersed in several heterogeneous data sources. These peculiarities make that geographic information retrieval being a non-trivial task, considering that the spatial data are often unstructured and built by different collaborative communities from social networks. The problem arises when user queries are performed with different levels of semantic granularity. This fact is very typical in social communities, where users have different levels of expertise. In this paper, a novelty approach based on three matching-query layers driven by ontologies on the heterogeneous data sources is presented. A technique of query contextualization is proposed for addressing to available heterogeneous data sources including social networks. It consists of contextualizing a query in which whether a data source does not contain a relevant result, other sources either provide an answer or in the best case, each one adds a relevant answer to the set of results. This approach is a collaborative learning system based on experience level of users in different domains. The retrieval process is achieved from three domains: temporal, geographical and social, which are involved in the user-content context. The work is oriented towards defining a GIScience collaborative learning for geographic information retrieval, using social networks, web and geodatabases.  相似文献   

13.
信息检索与过滤中的信息需求表示方法   总被引:3,自引:0,他引:3  
信息需求的表示方法是影响信息检索和信息过滤结果的重要因素。介绍了一些基本的信息需求表示方法,并对各种表示方法对信息检索和信息过滤结果产生的影响进行了分析和比较,最后提出了改进这些方法的一些思想。  相似文献   

14.
张静  俞辉 《计算机应用》2008,28(1):199-201,
针对包含复杂语义信息的视频检索的需要,提出了一种基于关系代数的多模态信息融合视频检索模型,该模型充分利用视频包含的文本、图像、高层语义概念等多模态特征,构造了对应于多个视频特征的查询模块,并创新地使用关系代数表达式对查询得到的多模态信息进行融合。实验表明,该模型能够充分发挥多模型视频检索及基于关系代数表达式的融合策略在复杂语义视频检索中的优势,得到较好的查询结果。  相似文献   

15.
This paper describes a distributed system for agricultural monitoring in Ukraine at two levels, namely, at ministerial level and at agricultural enterprise level. Crop monitoring is performed using data and products obtained by moderate and high-resolution remote sensing satellites. The system includes a geoportal with a Web interface and a desktop geographic information system (GIS) with additional functions of automatic data retrieval and business-logic analysis. The system is constructed using open-source software that conforms to OGC standards for geospatial information management.  相似文献   

16.
于静  吴国全  卢燚 《计算机应用》2010,30(6):1664-1667
现有政务信息检索系统存在两个主要问题:一是采用基于关键词匹配的检索技术忽略了对用户检索条件的语义理解,缺乏对于文档实质内涵的准确描述;二是由于对政务信息领域知识的缺乏,用户不能很好地提出符合自己检索需求的检索条件。针对这些问题,提出了基于领域本体的政务信息检索方法,即通过引入本体,在文档和检索条件间建立一种基于本体的由本体中的词汇集组成的结构化的对应关系;设计并实现了相应的概念词抽取、检索条件扩展算法以及原型系统。实验结果表明,该方法在检索的查全率和查准率方面都有很大的提升。  相似文献   

17.
基于本体的智能信息检索系统的构建方法   总被引:1,自引:1,他引:0  
为了解决目前传统的信息检索工具返回大量无关的信息或漏检有用信息的问题,首先引入了本体的基本概念及其在信息检索中的用途,在此基础上提出了一种基于本体的智能信息检索系统模型.该模型首先使用基于SOM神经网络和分层聚类的两阶聚类算法自动的产生本体,免除了人工构造本体的繁琐,然后利用本体中概念及概念之间明确的关系描述,将用户提出的检索要求进行语义上的扩充,使信息检索过程更加智能化,大大提高了检索的查全率和查准率.  相似文献   

18.
多媒体信息由于维度高、数据量大、可解释性差等特征制约了其检索性能,提出了基于自然语言理解的智能化多媒体信息检索系统模型。该系统基于自然语言理解、数据挖掘、自反馈等技术的运用,在一定程度上扩大了检索范围,提高了检索准确率。  相似文献   

19.
为了从这些海量信息中获取“有用的、满足用户需求的信息”,提出一个基于Hadoop和Lucene技术的分布式检索系统架构处理Web电子产品信息检索。利用Hadoop的Map和Reduce实现分布式索引文件的存储,通过Lucene检索技术实现索引文件的访问,从而提高信息检索的效率。并且针对Lucene_Hadoop架构存在粗粒度检索问题,提出了一种细粒度检索方法,减少了系统建立索引的时间。实验表明基于Hadoop和Lucene的分布式检索系统在Web电子产品信息中具有较高的检索性能。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号