首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
用户兴趣空间的Web页面聚类   总被引:4,自引:1,他引:4  
文章基于日志挖掘,提出一种在用户兴趣空间中进行Web页面聚类的算法。算法的基础是用户访问频率矩阵A。A的行对应页面向量,列对应用户向量,A中元素是用户对页面的访问频率。对A中的行做聚类可以对页面进行相关聚类,对A中的列做聚类可以对兴趣相似的用户进行聚类。文章认为A中的这两种聚类是一对对偶问题。文章基于A和A中这两种聚类在权重之间的对偶关系,提出了用户兴趣空间的概念。用户兴趣空间突出了用户的共同兴趣,是一个正交空间。实验结果表明,与在A中直接做页面聚类相比较,用户兴趣空间中的页面聚类取得了较好的效果。  相似文献   

2.
对搜索引擎中评分方法的研究   总被引:1,自引:1,他引:0       下载免费PDF全文
韩立新 《电子学报》2005,33(11):2094-2096
针对搜索引擎评分较为困难的问题,文中提出了一种评分方法.该方法使用协同过滤技术,在同一兴趣组中各用户所提供的搜索结果集的基础上,采用文中提出的并行关联规则算法对各用户的局部有向图进行预处理,找出兴趣组中各成员都感兴趣的页面.然后对这些页面的内容和超链接附近出现的文本以及链接结构进行分析.计算权威页面和引导页面,以找到虽不包括在检索结果中,但相关的页面.此外,在对所获得的页面进行评价时,除考虑Web页自身的链接结构和兴趣组中查询用户对页面的评价,还考虑兴趣组中其它成员对页面的评价和所有成员对页面的使用情况等因素,从而使推荐给用户的页面排序更加合理.  相似文献   

3.
基于UCL的个性化主动信息服务实验研究   总被引:1,自引:1,他引:0  
针对Internet检索的弊端,提出了基于UCL的主动信息服务方式。它对进入网络的资源进行UCL语义标引,依据UCL元素和用户行为建立用户兴趣模型,用于过滤和选择接收用户感兴趣的内容。在局域网和CATV网络环境下实验验证了上述方法的可行性和有效性。  相似文献   

4.
Web挖掘的敏感信息过滤模型   总被引:1,自引:0,他引:1  
论文分析了敏感信息过滤的重要性和常见的信息过滤手段,提出了一种基于Web挖掘的敏感信息过滤模型。该模型的主要思想是:采用Web挖掘技术对页面文字与图像内容以及用户访问行为特征进行分析,采用在线与离线分析相结合、并行处理等技术建立综合过滤体系,为建设文明、健康的网络环境提供技术保障。  相似文献   

5.
一种改进的基于浏览行为的用户兴趣模型   总被引:1,自引:0,他引:1  
主要讨论并建立了一种改进的基于用户浏览行为的用户兴趣模型,模型中综合考虑了Web用户对页面的浏览行为、对页面关键词的感兴趣程度、用户的短期兴趣和长期兴趣。在.NET平台下实现了WIPISES演示系统,在系统中嵌入本文所提出的改进的用户兴趣模型。仿真实验结果表明:使用本文改进的用户兴趣模型进行信息检索,其搜索效果优于目前主流的搜索引擎,而且Web用户的偏好性越强,WIPISES系统的优势也就越显著。  相似文献   

6.
单蓉 《信息技术》2011,(5):33-34,72
网络教育已成为现代教育技术主流的发展方向。提出了二层树状结构模型,并在此基础上,设计了一个基于基于浏览行为的个性化推荐系统(BB IRS)。系统可以通过离线和在线方式对用户的访问日志和交互数据分别进行挖掘,并通过根据用户的浏览速度计算用户对页面的兴趣度,根据该兴趣度是否大于阈值,系统采用不同的推荐策略。  相似文献   

7.
传统Markov链模型在用户浏览行为预测方面体现出较好的性能,但不能很好的体现出用户的兴趣度和所推荐的页面的重要性,因此本文提出类时齐Markov模型.该模型给不同的类别用户单独创建时齐Markov模型,并用时齐Markov模型的平稳分布表征用户的访问兴趣和页面的重要程度.本文进而提出了基于隐反馈的类时齐Markov推荐模型,在真实的WEB服务器日志数据上的实验证明,类时齐Markov模型具有更好的推荐性能.  相似文献   

8.
静态模型在推荐系统中往往将用户的兴趣偏好看作是固定不变的,而在一定程度上与实际并不符合.为此,基于隐Markov动态模型提出一种融合停留时间的类时齐隐Markov个性化推荐模型(ctqHMM).该模型用隐含状态变量的转移来模拟Web用户的兴趣变迁,并用停留时间来描述用户对某一偏好感兴趣的程度和所推荐页面的重要性.然后,提出一种基于该模型平稳分布的用户聚类方法,并将其用于推荐系统中.在真实的Web服务器访问记录数据上的实验证明,类时齐隐Markov模型具有更好的推荐性能.  相似文献   

9.
为了提高数字图书馆资源检索的有效性与高效性,提出一种基于关联规则的数字图书馆智能检索方法,该方法以用户的输入查询词为数据输入,并以输入作为项目集,采用贝叶斯网络构造检索模型,对输入项目集进行关联规则运算,最后获得查询的最终结果。采用贝叶斯网络构造数字图书馆的智能检索模型在很大程度上提高了资源检索的智能性及高效性,具有广泛的应用价值。  相似文献   

10.
文章提出了一种基于关联规则挖掘的关联检索建议模型。该模型提供关联关键词建议服务,引导用户进行有效检索。同时模型在用户检索兴趣分析和图书采购中也起到决策支持作用。  相似文献   

11.
网页信息抽取方法的研究   总被引:2,自引:0,他引:2  
信息抽取技术属于人工智能的一个分支.使用信息抽取技术可以人性化地从网页中把人们需要的信息抽取出来.文中提出的信息抽取技术是基于DOM和网页模板的一种归纳网页模板的新方法,它能很好地对各种布局元素的网页进行模板归纳,同时给出核心算法的C++实现.  相似文献   

12.
Computer users have long desired a personal software agent that could execute verbal commands. Today's World Wide Web (WWW or Web), with its point and click hypertext interface, makes a tremendous amount of information readily available online. A speech interface would make the Web even more powerful, allowing us to access information by surfing the Web by voice. TI have developed Speech Aware Multimedia (SAM) with this in mind, to make information on the Web more accessible and useful. They combined an innovative speech recognition engine with the Web to let anyone browse arbitrary Web pages using only speech as the input medium. Speech brings added flexibility and power to the classical Web interface and makes information access more natural. Today's speech recognition capability is well matched to Web browsing. The Web page provides a natural, well defined context for a speech recognition application. The recognition engine does not need to recognize any and all possible phrases, but only those phrases pertaining to the specific page in view at the moment. This context imposes limits that significantly aid recognition performance. Furthermore, the visual information on a page prompts the user on what to request and how to request it by voice  相似文献   

13.
Web页面的维文在线输入技术,能够在浏览器中脱离本机输入法而进行维文输入,实现维文网络在线文字交互,为网络系统提供跨平台的维文输入解决方案。阐述了Web页面维文在线输入技术的工作原理及基本设计思想,介绍了维文在线输入法的设计原则和输入法流程,对维文输入法进行了系统分析,给出实现模型,论述浏览器内嵌维文字体信息技术,实现在线、即时的维文输入。  相似文献   

14.
Discovery of Web communities, groups of Web pages sharing common interests, is important for assisting users' information retrieval from the Web. This paper describes a method for visualizing Web communities and their internal structures. visualization of Web communities in the form of graphs enables users to access related pages easily, and it often reflects the characteristics of the Web communities. Since related Web pages are often co-referred from the same Web page, the number of co-occurrences of references in a search engine is used for measuring the relation among pages. Two URLs are given to a search engine as keywords, and the value of the number of pages searched from both URLs divided by the number of pages searched from either URL, which is called the Jaccard coefficient, is calculated as the criteria for evaluating the relation between the two URLs. The value is used for determining the length of an edge in a graph so that vertices of related pages will be located close to each other. Our visualization system based on the method succeeds in clarifying various genres of Web communities, although the system does not interpret the contents of the pages. The method of calculating the Jaccard coefficient is easily processed by computer systems, and it is suitable for visualization using the data acquired from a search engine.  相似文献   

15.
沈明  邓玉芬  张博 《现代电子技术》2010,33(9):180-183,186
频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供参考。从网页数据挖掘的角度研究了三种频繁模式挖掘方式,这三种方式分别是:网页设置、网页序列以及网页图片挖掘。  相似文献   

16.
17.
To address the problem of extracting valuable information from massive Web pages in big data environments,a novel information extraction method based on node property and text content for massive Web pages was put forward.Web pages were converted into a document object model (DOM) tree,and a pruning and fusion algorithm was introduced to simplify the DOM tree.For each node in the DOM tree,both density property and vision property was defined and Web pages were pretreated based on these property values.A MapReduce framework was employed to realize parallel information extraction from massive Web pages.Simulation and experimental results demonstrate that the proposed extraction method can not only achieve better performance but also have higher scalability compared with other methods.  相似文献   

18.
由于任何人都可以在网上发布言论或发表信息,Web上的信息和信息源的准确性亟待验证。再者,电子商务在Web中的应用,Web中许多信息的准确性以及正确性与利益相关,使得Web用户的行为更受信任的制约,信任就成为Web发展的一大障碍。要建立信任首先就要关注如何建立Web用户对网站的初始信任。本文旨在论述初始信任的形成模型及之间如何影响。  相似文献   

19.
随着时代的发展,高校门户网站在日常招生、就业、教学过程中起到越来越重要的作用。高校门户网站页面布局的好坏直接决定着门户网站的美观程度。科学合理的页面布局不仅能够提高网页的显示效果,而且能够极大地提高网页的下载速度,提升网站访问者体验的满意度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号