首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 240 毫秒
1.
基于WWW缓冲的用户实时二维兴趣模型   总被引:4,自引:0,他引:4  
WWW缓冲技术通过将受欢迎的网页放到与客户较近的地方来提高用户存取这些网页的速度,如何有效充分地利用WWW缓冲中的信息,其关键是建立一个合适的用户兴趣模型和构造合适的兴趣挖掘算法.简单兴趣模型通过(词条,权重)来刻画兴趣.它没有深入挖掘这些兴趣之间的关联关系,因而在表达用户兴趣的时候,不能实现兴趣之间的关联.该文在充分分析WWW缓冲模型的基础上提出了实时二维兴趣模型,该模型的实时性可以保证挖掘出来的用户兴趣更能反映当前用户的兴趣状态;该模型引入的二维概念充分地考虑了用户兴趣之间的递推关系.该模型不是简单兴趣模型的简单扩充,而是模型和相关算法的全面改进。文章给出了二维兴趣模型的存储、二维兴趣的有效计算和二维兴趣的实时更新的相关方法。  相似文献   

2.
基于WWW信息浏览区域的查询语言设计   总被引:1,自引:0,他引:1  
刘振宇 《计算机工程》2001,27(4):118-119,158
提出了WWW信息浏览区域的概念。利用OEM模型把文档本身的表示(文档OEM对象)和它所代表的信息浏览区域的表示(区域OEM对象)完美地结合于一体,设计了一个面向WWW信息浏览区域的WWW信息查询语言--WAQL,给出了严格的语法定义,并进行了详细的语义解释,了基本的查询处理过程。  相似文献   

3.
目前搜索引擎返回的信息太多且难以根据用户的兴趣提供检索结果,而个性化推荐是一种旨在减轻用户在信息检索方面负担的有效方法.文中把内容过滤技术和文档聚类技术相结合,以改进的STC聚类方法组织搜索结果,主动推荐用户感兴趣的文档并将其中的Top-N对象预取到本地. WWW缓存中的Web文档代表了用户当前的兴趣,通过建立用户概率兴趣模型,在搜索结果STC聚类的基础上进行内容过滤.实验表明,基于搜索结果的Web预取模型具有较好的时间性能和较高的查准率.  相似文献   

4.
基于模糊概念图的文档聚类及其在Web中的应用   总被引:12,自引:0,他引:12  
陈宁  陈安  周龙骧  贾维嘉  罗三定 《软件学报》2002,13(8):1598-1605
随着World Wide Web上数据量的日益庞大,现有的搜索引擎已经不能满足用户日益增长的需求.利用数据挖掘技术,提高搜索效率,实现了查询的用户化.首先提出了模糊概念图的模型来描述词语间的关系,然后在聚类过程中引入概念知识,提出了基于模糊概念图的文档聚类算法,通过分析用户的浏览行为发现兴趣模式.在上述技术的基础上,给出了一种用户化的智能搜索系统的实现策略,通过分析概念间的关系和用户的兴趣模式,评价超链/文档和查询的相关程度,从而帮助用户得到更准确的信息.  相似文献   

5.
研究并实现了一个面向领域的Web挖掘系统WMS,能有效地帮助用户挖掘Web上的信息和知识,用户可以通过提交Web页面、文本文档、URLs或关键词,向系统表达自己希望获得的信息主题,系统自动学习用户对特定领域的兴趣.并依据用户对系统采集文档的反馈评估,不断自适应地调整用户兴趣模型.WMS依据用户兴趣模型,利用智能Agents,对用户感兴趣的有关信息进行搜索和过滤,并对主要相关Web站点的信息更新进行监测,利用人工神经网络和智能Agents技术,WMS对所积累的文档库进行信息和知识挖掘,并自动将新信息推荐给用户.  相似文献   

6.
基于Web的信息过滤机制   总被引:12,自引:0,他引:12  
信息过滤目的在于依据用户兴趣进行动态信息搜索以满足用户的需求。文章给出了基于Web的信息过滤机制。它根据用户信息需求,建立公共模板,利用搜索引擎获取信息源;然后利用文档与用户模板的匹配机制,将相关文档推送给用户。在文档结构分析和相关反馈的基础上,提出了特征抽取和权重分配算法;将布尔模型和向量空间模型相结合,提出了文档与用户模板匹配算法。  相似文献   

7.
基于浏览过程的LFU:一个新的WWW缓冲清理算法   总被引:2,自引:0,他引:2  
文章分析了WWW系统中用户活动的特点,提出了浏览过程的概念,并对传统的缓冲清理算法LFU进行了改进,提出了一个基于WWW浏览过程的LFU算法。  相似文献   

8.
基于概念语义的用户兴趣模型的研究   总被引:1,自引:0,他引:1  
用户建模是个性化服务的关键技术。从抽取概念集合出发,结合预先定义的语义概念层次树,通过机器学习建立概念层次树中各分枝的规范化表示,挖掘蕴藏在文档中的主题语义概念集合,并将概念映射到概念层次树中,从而建立用户兴趣模型。为了检验提出的模型,分别从主题语义概念集合的抽取和信息过滤方面进行了实验。测试结果表明,具有较好的用户建模性能。  相似文献   

9.
信息检索是与数据库系统并行发展了很多年的一个领域,它主要研究大量文本的信息组织和检索。典型的信息检索问题是基于用户的输入来定位相关的文本。而文本的相关性是一个模糊的概念,为了对这个模糊的概念以客观的度量,提出了一种新的文本间相关性的计算方法,该方法利用词频矩阵和模糊相似矩阵,在基于相关性检索的一组文档中,使用模糊聚类中的最大树算法,计算出一组文档间的相关度,最后用一个实例加以说明,得到了比较客观的结果。  相似文献   

10.
XML正在迅速成为WWW上采用的信息交换、表示和存储手段之一,论文对XML文档进行了多层次的抽象,得出了扩展XML语法和自动机等概念。作为一个应用,论文利用这一抽象对W3C推荐的两种最通用的模式进行上述语法观点的分类,从而有利于在不同的应用中选取合适的模式。  相似文献   

11.
数据挖掘技术在Web预取中的应用研究   总被引:69,自引:0,他引:69  
WWW以其多媒体的传输及良好的交互性而倍受青睐,虽然近几年来网络速度得到了很大的提高,但是由于接入Internet的用户数量剧增以及Web服务和网络固有的延迟,使得网络越来越拥护,用户的服务质量得不到很好的保证。为此文中提出了一种智能Web预取技术,它能够加快用户浏览Web页面时获取页面的速度。该技术通过简化的WWW数据模型表示用户浏览器缓冲器中的数据,在此基础上利用数据挖掘技术挖掘用户的兴趣关联规则,存放在兴趣关联知识库中,作为对用户行为进行预测的依据。在用户端,智能代理负责用户兴趣的挖掘及基于兴趣关联知识库的Web预取,从而对用户实现透明的浏览器加速。  相似文献   

12.
The World Wide Web (WWW) has been recognized as the ultimate and unique source of information for information retrieval and knowledge discovery communities. Tremendous amount of knowledge are recorded using various types of media, producing enormous amount of web pages in the WWW. Retrieval of required information from the WWW is thus an arduous task. Different schemes for retrieving web pages have been used by the WWW community. One of the most widely used scheme is to traverse predefined web directories to reach a user's goal. These web directories are compiled or classified folders of web pages and are usually organized into hierarchical structures. The classification of web pages into proper directories and the organization of directory hierarchies are generally performed by human experts. In this work, we provide a corpus-based method that applies a kind of text mining techniques on a corpus of web pages to automatically create web directories and organize them into hierarchies. The method is based on the self-organizing map learning algorithm and requires no human intervention during the construction of web directories and hierarchies. The experiments show that our method can produce comprehensible and reasonable web directories and hierarchies.  相似文献   

13.
了解用户的兴趣是电子商务网站实现个性化的基础,该文提出了一种分析用户兴趣度的新方法,该方法首先根据网站主索引页上的超链接将网站上的网页模糊分类,并通过对Web日志的统计,得出各交叉页的模糊度,然后综合考虑用户浏览网页的时间长度、点击网页的次数,利用模糊综合评判得出用户对于各网页分类的兴趣度,再与各网页分类的平均兴趣度水平作对比,从而发现用户的兴趣所在,实验表明该方法是有效的。  相似文献   

14.
结合使用挖掘和内容挖掘的web推荐服务   总被引:10,自引:1,他引:9  
随着Internet的基础结构不断扩大和其所含信息的持续增长,Internet用户越来越感觉容易在WWW服务中“资源迷向”。提高用户访问效率的方法有页面预取技术,站点动态重构技术和web个性化推荐技术等。现有的大多数web个性化推荐技术主要是基于用户使用记录的数据挖掘方法,没有或很少考虑结合页面内容—这才是用户真正感兴趣的。该文提出一种结合用户使用挖掘和内容挖掘的web推荐服务,该推荐服务根据频繁最大前向访问路径,提出含有导航页和内容页的频繁访问路径图概念,根据滑动窗口内的最近用户访问页面内容和候选推荐集中页面内容相关性,来向用户提供个性化推荐服务。经推荐质量分析,这种方法具有较好的推荐优化能力。  相似文献   

15.
基于多知识的Web网页信息抽取方法   总被引:10,自引:1,他引:9  
从Web网页中自动抽取所需要的信息内容,是互联网信息智能搜取的一个重要研究课题,为有效解决网页信息抽取所需的信息描述知识获取问题,这里提出了一个种基于多知识的Web网页信息抽取方法(简称MKIE方法)。该方法将网页信息抽取所需的知识分为二类,一类是描绘网页内容本身表示特点,以及识别各网信息对象的确定模式知识,另一类则描述网页信息记录块,以及各网页信息对象的非确定模式知识,MKIE方法根据前一类知识,动态分析获得后一类知识;并利用这两类知识,最终完全从信息内容类似担其表现形式各异的网页中,抽取出所需要的信息,美大学教员论文网页信息抽取实验结果表明,MKIE方法具有较强的网而信息自动识别与抽取能力。  相似文献   

16.
对 Web 页面和用户的聚类算法提出了一种CAFM聚类算法.在该算法中,把模糊多重集的概念引入到模糊聚类算法中,将反映用户浏览行为的页面点击次数、停留时间、用户偏好等因素用模糊多重集来综合刻画用户访问站点的兴趣度,再以此来建立模糊多重相似矩阵直接进行聚类.通过实例说明了算法的具体计算过程和可行性.  相似文献   

17.
用户兴趣的结构和个性化服务的实现   总被引:3,自引:0,他引:3  
探讨用户兴趣及其转移的概念和用户兴趣库的结构,探讨如何通过用户选答问题采建立并利用反馈信息及服务器上日志记录的分析,修改用户兴趣库。采用这种算法,网站可以跟踪并学习用户群的兴趣,完善用户兴趣库。系统可借助这种动态结构,向不同的用户群推荐适合的预送页面序列,逐步达到个性化服务的目标。  相似文献   

18.
Search engines are useful because they allow the user to find information of interest from the World Wide Web (WWW). However, most of the popular search engines today are textual; they do not allow the user to find images from the web. For effective retrieval, determining the semantics of the images is essential. In this paper, we describe the problems in determining the semantics of images on the WWW and the approach of AMORE, a WWW search engine that we have developed. AMORE's techniques can be extended to other media like audio and video. We explain how we assign keywords to the images based on HTML pages and the method to determine similar images based on the assigned text. We also discuss some statistics showing the effectiveness of our technique. Finally, we present the visual interface of AMORE with the help of several retrieval scenarios.  相似文献   

19.
基于模糊模拟的加权偏爱浏览模式的挖掘   总被引:1,自引:0,他引:1  
每个网页由不同的专家给出语义上的重要性评估,这些语义评估再被刻画成相应的模糊语言变量,通过模糊模拟的方法,这些模糊语言变量被转化成表示网页重要性的权重。此外,简单地认为用户的访问频度反映了用户的访问兴趣是不准确的,因此在提出的加权支持度和偏爱度概念的基础上,从建立的包含了所有用户浏览信息的FLaAT(Frequent Link and Access Tree)上,挖掘用户偏爱的加权浏览模式。试验证明该算法是行之有效的。  相似文献   

20.
The Semantic Web (SW) is a meta-web built on the existing WWW to facilitate its access. SW expresses and exploits dependencies between web pages to yield focused search results. Manual annotation of web pages towards building a SW is hindered by at least two user dependent factors: users do not agree on an annotation standard, which can be used to extricate their pages inter-dependencies; and they are simply too lazy to use, undertake and maintain annotation of pages. In this paper, we present an alternative to exploit web pages dependencies: as users surf the net, they create a virtual surfing trail which can be shared with other users, this parallels social navigation for knowledge. We capture and use these trails to allow subsequent intelligent search of the web.People surfing the net with different interests and objectives do not leave similar and mutually beneficial trails. However, individuals in a given interest group produce trails that are of interest to the whole group. Moreover, special interest groups will be higher motivated than casual users to rate utility of pages they browse. In this paper, we introduce our system KAPUST1.2 (Keeper And Processor of User Surfing Trails). It captures user trails as they search the internet. It constructs a semantic web structure from the trails. The semantic web structure is expressed as a conceptual lattice guiding future searches. KAPUST is deployed as an E-learning software for an undergraduate class. First results indicated that indeed it is possible to process surfing trails into useful knowledge structures which can later be used to produce intelligent searching.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号