共查询到20条相似文献,搜索用时 31 毫秒
1.
1 引言信息检索(information retrieval,IR)指的是从一个文档集合中查找出包含有与用户的信息需求相关的信息内容的文档或文本。Web IR(Web information retrieval)指的是在Web环境下的IR问题。Web的出现,将含量、异构、动态数据的处理这样一个新的课题摆在了人们的面前。本文在分析了WebIR的特点,特别是Web用户信息检索的特点之后,从用户需求的角度,对架构Web IR的理想的服务模型提出了我们的一个构想,并分析了理想Web IR模式实现所需要的主要技术支持。 相似文献
2.
王水萍 《网络安全技术与应用》2013,(11):18+28-18,28
随着网络信息的急速膨胀,为了方便用户快速查找所需信息,满足不同用户的个性化需求,在传统的信息检索系统的基础上发展个性化信息检索已成为必然.本文研究了个性化信息检索系统的整体架构设计,描述了该系统的主要功能模块和各个功能模块的工作机制. 相似文献
3.
基于Web挖掘的智能门户搜索引擎的研究 总被引:31,自引:0,他引:31
搜索引擎是人们在Internet上快速获得信息的重要工具之一,但是由于中文自身的特点,使得检索结果的准确性和相关性不是很高,将Web挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将会给用户提供一个高效、准确的Web检索工具。文章首先介绍了搜索引擎的工作原理和相关概念,然后介绍了Web挖掘的定义、分类和应用。最后,详细讨论了Web挖掘技术在智能搜索引擎的重要应用。 相似文献
4.
We present the Flink system for the extraction, aggregation and visualization of online social networks. Flink employs semantic technology for reasoning with personal information extracted from a number of electronic information sources including web pages, emails, publication archives and FOAF profiles. The acquired knowledge is used for the purposes of social network analysis and for generating a web-based presentation of the community. We demonstrate our novel method to social science based on electronic data using the example of the Semantic Web research community. 相似文献
5.
文章针对当前网络管理的发展趋势,汲取基于Web网络管理的优点,考虑到网络性能管理的具体应用,提出了一种新的基于Web的分布式网络性能管理系统模型,并对其结构和实现进行了具体的分析。 相似文献
6.
7.
Web搜索中的数据挖掘技术研究 总被引:4,自引:0,他引:4
WWW已经成为世界上是大的分布式信息系统,如何快速有效地搜索用户所需的资源一直是研究热点。Web挖掘也已经成为数据挖掘中相对成熟的一个分支。本文针对Web资源搜索中利用的相关Web挖掘技术做一个综述。文章首先对目前流行的Web内容挖掘方面的常用技术进行了研究分析,然后着重研究了Web结构挖掘技术,介绍并评价了多种算法模型。接着介绍了用户使用的挖掘,并提出了Web内容挖掘技术,结构挖掘技术和用户使用挖掘相结合,应用于开发智能型搜索引擎的趋势。 相似文献
8.
Self-supervised relation extraction from the Web 总被引:3,自引:3,他引:0
9.
数据挖掘在智能搜索引擎中的应用 总被引:5,自引:9,他引:5
随着互联网的迅速发展,WWW上信息增长越来越快,传统搜索引擎已经不能满足用户的需求。将数据挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将会给用户提供一个高效、准确的Web检索工具。文章首先介绍了搜索引擎的工作原理和相关概念,然后介绍了数据挖掘的概念。最后,详细讨论了数据挖掘技术在智能搜索引擎中的重要应用。 相似文献
10.
11.
罗伟生 《计算机光盘软件与应用》2011,(14)
信息挖掘的关键技术就是如何将用户所需的关键词与数据库、网络中的关键词进行匹配并进行筛选和甄别。为了完成此过程,人们利用爬虫技术,对网络信息进行搜索、获取、暂存、分析,并形成最终的搜索结果。在此过程中Java所形成的搜索引擎技术起到了较好的应用效果。 相似文献
12.
In recent years, there has been considerable interest in the analysis of social network data. In this paper, we propose a novel automatic generation algorithm of social network data - the Biclustering Algorithm for Social Network Data algorithm. The algorithm introduces biclustering to social network analysis for automatic identification of associations among a group of actors and entities. The algorithm is different from existing ones in that it employs a combination of min-max and pattern searching procedures to construct hierarchical biclusters and discover the relationships among these actors, in order to easily interpret social network data. The algorithm is not subject to convexity limitations, and does not need to use derivatives information. 相似文献
13.
现阶段,用户常常希望利用搜索引擎获得期望的实体,然而传统搜索引擎只能返回包含关键字的多个文档,并不能直接返回用户想要的答案,且现有的实体排序技术主要采用权值叠加的方法,需要很多先验知识对权值进行训练。文中从搜索引擎返回的文档中提取多个候选实体,并提出一种基于图结构的算法PERA(Probabilistic Entity Ranking Algorithm),利用随机游走的思想,在不需要知道相关先验知识的情况下,将候选实体排序。经过实验验证,各个类型的正确实体均有着较高的排序分值。 相似文献
14.
基于P2P的个性化Web搜索系统的设计与实现 总被引:1,自引:0,他引:1
针对中心化的Web信息搜索系统在覆盖率、及时性、个性化、可扩展性等方面存在的问题,提出了一种基于Peer-to-Peer(P2P)的可扩展、个性化的Web搜索系统PeerBridge。PeerBridge基于分布式哈希表组织大量的网络结点形成有组织的P2P覆盖网络,每个对等体作为一个主题搜索引擎,根据用户兴趣从Web中搜索特定主题相关的信息,而具有相似主题的对等体被聚集在一起形成基于主题的对等体簇,协作进行Web搜索与信息共享。并采用主题驱动的Web爬行、基于语义概念的文档分类、个性化的链接分析和基于主题划分的P2P搜索等机制来改善PeerBridge的性能。 相似文献
15.
16.
17.
Web信息采集研究进展 总被引:14,自引:1,他引:14
1.简介随着Internet/Intranet的迅速发展,网络正深刻地改变着我们的生活。而在网上发展最为迅猛的WWW(World Wide Web)技术,以其直观、方便的使用方式和丰富的表达能力,已逐渐成为Internet上最重要的信息发布和传输方式。然而,Web信息的急速膨胀,在给人们提供丰富的资源的同时,又使人们在对它们的有效使用方面面临一个巨大的挑战。为此,人们发展了以Web搜索引擎为主的检索服务,并且随着 相似文献
18.
19.
20.
在阐述了Web数据挖掘的分类、Web数据挖掘的方法和Web数据挖掘具体过程的基础上,设计了校园网搜索引擎系统的整体架构,论述了搜索引擎系统主要功能模块设计,提出了Web数据挖掘技术在校园网搜索引擎系统中的应用。 相似文献