首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 343 毫秒
1.
基于用户浏览行为度量浏览兴趣的研究   总被引:1,自引:0,他引:1  
准确地度量用户浏览兴趣是Web使用模式挖掘的基础,本文针对Web使用模式挖掘,首先分析了已有的度量用户浏览兴趣方式的不足之处,提出了一种基于用户浏览行为度量用户浏览兴趣的方法。分析了现有Web使用模式挖掘的数据采集方式,提出了一种综合利用服务器日志文件和客户端数据获取用户浏览信息的方法,从用户浏览网站的数据中抽取感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构或为用户提供个性化的服务。  相似文献   

2.
基于Web Service的数据抽取研究与设计   总被引:1,自引:0,他引:1  
Web Service是新兴的技术,将Web Service技术运用到数据抽取中,可以快速、准确地将数据抽取出来,并且能够在不同网络环境下进行数据处理。阐述Web Service的优点和结构,从Web Service的原理入手,以网格项目做背景,设计数据抽取的模型,讨论Web Service在数据抽取中的设计方法,并进行通过Web Service进行数据抽取的相关实验。  相似文献   

3.
WWW是目前使用最为广泛的Internet信息服务系统。存放WWW信息的Web文档称作超文本或超媒体,包含各种多媒体对象和指向其他Web文档的指针(超级链接或超链),这些链接"指引"用户进一步读取存放在其他Web服务器上的信息,那些服务器又指引更多的服务器。这样,在环球范围内Web服务器互相指引而形成的信息网便出现了。WWW为用户提供了一个搜索和浏览信息的工具、但WWW是一个信息的海洋,数亿万计的Web文档散布在世界各地的成千上万个Web服务器上,并且每个服务器自主管理自己的资源.没有一个统一的管理机制.因此要在Web上搜索所需…  相似文献   

4.
研究了Excel中获取Web数据的问题。通过Excel菜单功能给出了一种直接获取数据的功能。在此基础上利用VBA技术给出了另一种技术,这种技术通过在Excel中打开VBA开发环境,利用循环结构,每次取得用户选择的数据信息得到一系列具有相似结构的web数据,自动按照用户指定的方式存入指定区域,这些功能统一通过用户事先编写的VBA程序来自动完成,对于需要获取大量Web数据的用户而言利用该技术可以节省大量时间。  相似文献   

5.
如今,在Web图像检索过程中,有很多成熟的技术,如基于Web的数据仓库,Web数据挖掘,Web数据源集成技术。因此,必须建立适当的数据模型页面,数据模型可有效地用来获得从Web信息。为了应对中国的数据网络,还必须使用一系列中国自然语言处理技术。根据对比技术,自动分割,其它如信息抽取,自动摘要,自动文档分类,中国话和像自动发现的概念来确定语义关系的词与词之间的技术概念是必不可少的。需要实现上述坚实的技术积累  相似文献   

6.
将数据仓库技术运用在小灵通网络质量分析中,能深层次地挖掘、分析当前和小灵通历史的业务数据以及相关环境数据,自动快速获取其中有用的网络质量信息,提供快速、准确和便捷的决策支持数据,有目的的采取优化手段、优化网络质量,提高小灵通网络的运行质量、用户满意度和小灵通网络的经济效益。  相似文献   

7.
随着互联网技术的快速发展,人们能够及时地获取大量的新闻文本信息,如何从新闻中自动获取关键信息,把新闻中具有价值的信息转化为结构化数据,从而快速有效地获取有用的知识已是迫切需求.实体关系抽取是获取关键信息的方法之一,但目前关于中文的实体关系抽取工作较少.针对基于长短时记忆网络的中文实体识别模型难于提取长距离的依存关系特征...  相似文献   

8.
Web数据挖掘研究与探讨   总被引:18,自引:0,他引:18  
随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。由Web数据具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘。为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新的研究领域——Web数据挖掘。基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘。综述了基于Web的数据挖掘技术概念与原理,并且介绍用以Web数据挖掘实现的一种全新的技术——XML。如何进一步开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究。Web数据挖掘的研究具有极大的挑战性,同时又具有极大的开发潜力。  相似文献   

9.
文章介绍一个基于Web的信息获取系统的框架与实现,给出了系统总体结构,分析了信息采集子系统、原始资料处理子系统、系统配置子系统和推送,检索子系统。实践证明,本Web信息获取系统能够对Internet上用户提交的请求进行自动采集、自动分类,对后继的信息处理提供了充分的支持。  相似文献   

10.
数据挖掘和World Wide Web是当前计算机科学两个重要的研究领域,将二者结合起来就形成了新的研究领域Web数据挖掘。Web数据挖掘是从WWW上发现和分析有用的信息,帮助人们从WWW中提取知识,改进站点设计,提供个性化服务。本文侧重于Web挖掘系统自身的构建,建立了一个基于数据挖掘技术的Web挖掘系统的原型Web_Dins,为了提供一个实用的Web挖掘工具的模型,帮助人们更有效地从Web上获取知识。最后本文以股票系统为例简要介绍Web挖掘系统原型在实际领域中的一种应用。  相似文献   

11.
基于Agent的面向主题信息查询研究   总被引:1,自引:0,他引:1  
随着网络应用的普及,Web站点中的信息量以几何级数增长,信息用户迫切需要从大量的网络信息资源中快速有效地找到自己的所需。基于Agent思想,通过建立和优化“用户兴趣模型”,进行面向主题、个性化的信息查询,从而提高查询的快速性和准确性,并根据信息用户的兴趣模型,实现信息推送服务,主动为用户提供所需信息。  相似文献   

12.
李向阳  陆建江  张亚非 《电子学报》2004,32(11):1915-1917
提出一种基于竞争分类的Web信息抽取方法,以信息片段与样本之间的相似度作为竞争力,通过信息片段对信息模板槽的竞争实现对信息片段的分类和噪声信息的过滤,直接从分类的角度抽取Web信息.较之基于规则的信息抽取方法,竞争分类法只需用户提供少量的标记样本.测试表明,该方法在没有用户提供特征提示信息的情况下,抽取信息仍能保持较高的准确率,适应性强;对数据项缺失和顺序变化较大的数据源,竞争分类法也具有较好的健壮性.  相似文献   

13.
随着网络信息量的爆炸式增长,人们查找信息越来越难.Web搜索引擎的出现在一定程度上解决了这种矛盾,介绍中文搜索引擎技术时,首先讲述搜索引擎的发展简史和基本框架,然后介绍各组成部分的工作原理和关键技术.最后对中文搜索引擎的发展进行展望,总结出中文搜索引擎的主要发展方向是:个性化搜索、智能化搜索、多媒体搜索、对等搜索.  相似文献   

14.
Computer users have long desired a personal software agent that could execute verbal commands. Today's World Wide Web (WWW or Web), with its point and click hypertext interface, makes a tremendous amount of information readily available online. A speech interface would make the Web even more powerful, allowing us to access information by surfing the Web by voice. TI have developed Speech Aware Multimedia (SAM) with this in mind, to make information on the Web more accessible and useful. They combined an innovative speech recognition engine with the Web to let anyone browse arbitrary Web pages using only speech as the input medium. Speech brings added flexibility and power to the classical Web interface and makes information access more natural. Today's speech recognition capability is well matched to Web browsing. The Web page provides a natural, well defined context for a speech recognition application. The recognition engine does not need to recognize any and all possible phrases, but only those phrases pertaining to the specific page in view at the moment. This context imposes limits that significantly aid recognition performance. Furthermore, the visual information on a page prompts the user on what to request and how to request it by voice  相似文献   

15.
基于网络用户行为的相关页面挖掘模型   总被引:11,自引:0,他引:11  
文章提出了一种基于网络用户行为的相关页面挖掘模型。模型采用统计的方法对proxy日志进行挖掘。模型的输入是一个WEB页面,输出是一组与之相关的页面。模型的假设基础是一组兴趣相似的人访问的页面有可能相关。模型从用户群中找出对输入页面感兴趣的用户,通过聚类从这些用户中找出一类具有相似兴趣背景且对输入页面最感兴趣的用户,综合这类用户感兴趣的页面,从中挖掘出与输入页面相关的页面。该模型与目前流行的相关页面检索算法的最大区别在于分析的对象是网络用户行为,因为模型认为页面是否相关的最终判定者应该是用户,通过分析网络用户行为能够更好地挖掘用户在页面相关判定上的潜在意识。用户对页面的兴趣度基于用户对页面的访问频率而定义。实验表明,该模型是可行的。该模型可用于改进传统的IR,提供相关反馈和查询扩展,使其更加适应Internet检索。该模型也可用于内容安全方面的相关主题预测。  相似文献   

16.
基于特征元素和关联规则的图象分类方法   总被引:3,自引:0,他引:3  
李勍  章毓晋 《电子学报》2002,30(9):1262-1265
图象分类是搜索引擎中的重要模块.本文提出了一种基于特征元素的图象分类方法.特征元素与特征向量相比能够根据人的主观感知来提取图象的视觉特征.与传统的基于特征向量的图象分类方法不同,本文提出的图象分类方法不计算特征空间中特征向量之间的距离,而是通过关联规则挖掘发现图象的特征元素与图象所属类别之间的联系.本文实现了该分类算法并将其与一种基于特征向量的图象分类方法NFL相比较.实验的结果证实了所提方法的优越性.  相似文献   

17.
一个面向Internet的个性化信息检索系统模型   总被引:16,自引:3,他引:16  
韩立新  陈贵海  谢立 《电子学报》2002,30(2):240-244
随着Internet上的信息量急剧增加,如何使用户获得有用的信息已成为信息检索系统急需解决的问题.文中提出了一个个性化信息检索系统模型(Parch).该模型结合用户访问模式和类层次结构来检索用户需要的信息.文中还提出了多个算法,这些算法综合运用数据挖掘、情报检索和机器学习等技术,较好地解决了在生成用户访问模式时人工干预较多、自适应性较差、准确性较差以及在构造类层次结构时出现计算量较大所造成聚集速度较慢的问题.  相似文献   

18.
对搜索引擎中评分方法的研究   总被引:1,自引:1,他引:0       下载免费PDF全文
韩立新 《电子学报》2005,33(11):2094-2096
针对搜索引擎评分较为困难的问题,文中提出了一种评分方法.该方法使用协同过滤技术,在同一兴趣组中各用户所提供的搜索结果集的基础上,采用文中提出的并行关联规则算法对各用户的局部有向图进行预处理,找出兴趣组中各成员都感兴趣的页面.然后对这些页面的内容和超链接附近出现的文本以及链接结构进行分析.计算权威页面和引导页面,以找到虽不包括在检索结果中,但相关的页面.此外,在对所获得的页面进行评价时,除考虑Web页自身的链接结构和兴趣组中查询用户对页面的评价,还考虑兴趣组中其它成员对页面的评价和所有成员对页面的使用情况等因素,从而使推荐给用户的页面排序更加合理.  相似文献   

19.
随着信息时代的来临,海量信息不断地涌入因特网,人们想要获得自己所需要的信息,越来越离不开搜索引擎。但目前的搜索引擎往往无法满足人们搜索信息的根本要求,常常有人抱怨,我所搜索的信息都是我不需要的。针对现有搜索引擎的不足,把信息推送技术引入到搜索引擎中,建立了一种基于信息推送的搜索引擎模型,解决了现有搜索引擎在搜索过程中存在的资源迷向问题,真正实现了信息找人的搜索方式。  相似文献   

20.
Internet technologies are constantly evolving as well as the way people use them. Search engines help users to find higher and better relevant results to their searches. Cloud Computing is an evolution of the Internet services and provides a step further ecosystem that can be used to improve the search of more relevant results. Each search engine is based on different modules in order to retrieve the results expected by users using specific keywords. Social networks appear as a reliable Web technology that can directly support a content search. Several studies have been performed showing the growth of social networks in people lives. Using the cloud computing paradigm it is possible to propose a more scalable and efficient way to explore public information available on online social networks. This paper includes the analyses of several social networks services, available contents, cloud-crawlers, and information extraction. In order to collect relevant data from social networks, a social crawler on cloud is proposed. The new approach provides a cloud-based crawler for low-cost, effective, and personalized search models. Moreover, a new algorithm to rank Web documents is proposed and demonstrated. The proposed system is evaluated in comparison with the top Internet search engine, Google, its behavior is very promising, and it is ready for use.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号