首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
文章提出了一种基于ISODATA的用户访问路径聚类算法,根据用户的访问兴趣定义了相似性测量手段和聚类中心。在对Web站点的访问日志进行事务识别后,根据群体用户对Web站点的访问顺序进行聚类,则每一个聚类集反映出该聚类集中的全体用户具有相似的访问兴趣。  相似文献   

2.
用户兴趣空间的Web页面聚类   总被引:4,自引:1,他引:4  
文章基于日志挖掘,提出一种在用户兴趣空间中进行Web页面聚类的算法。算法的基础是用户访问频率矩阵A。A的行对应页面向量,列对应用户向量,A中元素是用户对页面的访问频率。对A中的行做聚类可以对页面进行相关聚类,对A中的列做聚类可以对兴趣相似的用户进行聚类。文章认为A中的这两种聚类是一对对偶问题。文章基于A和A中这两种聚类在权重之间的对偶关系,提出了用户兴趣空间的概念。用户兴趣空间突出了用户的共同兴趣,是一个正交空间。实验结果表明,与在A中直接做页面聚类相比较,用户兴趣空间中的页面聚类取得了较好的效果。  相似文献   

3.
本文提出了一种基于遗传算法.结合网站拓朴分析.对URL实行树型层次编码为基础的Web用户聚类计算模型。讨论了描述、跟踪用户行为,实现Web用户聚类的方法。阐述聚类所要考虑的相关问题,并给出聚类的实验分析。  相似文献   

4.
基于兴趣度的Web用户聚类方法   总被引:1,自引:1,他引:0  
现有的Web用户聚类方法都是通过对用户喜好页面的访问模式分析来建立用户聚类,没有充分考虑时间意识、用户兴趣、用户访问模式之间的关系与影响.针对这一问题,在时间意识的Web用户聚类基础之上,提出了基于兴趣度的Web用户聚类方法.通过对日志文件中的用户访问模式进行分析,计算用户兴趣度.结合渐进遗忘算法,对用户兴趣爱好进行调整与更新,并在此基础上对用户进行聚类.实验表明,本方法能够更好地分析用户访问模式,更准确地计算用户兴趣,具有更好的聚类效果.  相似文献   

5.
根据Web用户的浏览历史建立用户浏览预测模型是Web环境下实现个性化服务和开发各种浏览导航工具的关键。该文首先利用PLSA模型对Web用户进行用户聚类,然后建立基于用户类别的混合Markov链用户浏览预测模型,该模型更能准确地描述用户浏览特征。实验结果表明了该模型的优越性。  相似文献   

6.
静态模型在推荐系统中往往将用户的兴趣偏好看作是固定不变的,而在一定程度上与实际并不符合.为此,基于隐Markov动态模型提出一种融合停留时间的类时齐隐Markov个性化推荐模型(ctqHMM).该模型用隐含状态变量的转移来模拟Web用户的兴趣变迁,并用停留时间来描述用户对某一偏好感兴趣的程度和所推荐页面的重要性.然后,提出一种基于该模型平稳分布的用户聚类方法,并将其用于推荐系统中.在真实的Web服务器访问记录数据上的实验证明,类时齐隐Markov模型具有更好的推荐性能.  相似文献   

7.
随着网络技术飞速发展,对搜索引擎的要求也越来越高,然而对人机交互的的支持却没有充分体现出来。本文通过分析Web用户的不同检索需求,提出了以用户为中心的用户事务聚类方法,在聚类的相似性度量上,不仅考虑了用户在Web事务中对某页面的访问次数,还考虑了在该页面上的浏览时间。对用户查询请求不断进行修正后反复进行检索,从而有效提高了信息检索系统的精度和信息检索的协同工作能力,使得人机交互更加高效。  相似文献   

8.
本文主要讨论了聚类算法在Web文本挖掘中的应用研究情况.着重总结了Web文本挖掘的特点、一般过程和适用于Web文本聚类的算法条件,总结了当前的研究热点,并提出了Web文本聚类算法的发展方向.  相似文献   

9.
本文主要讨论了聚类算法在Web文本挖掘中的应用研究情况。着重总结了Web文本挖掘的特点、一般过程和适用于Web文本聚类的算法条件,总结了当前的研究热点,并提出了Web文本聚类算法的发展方向。  相似文献   

10.
基于Web的文本挖掘研究   总被引:10,自引:6,他引:4  
基于Web的文本挖掘是数据挖掘的重要组成部分,文章重点对文本特征提取、文本分类、文本聚类等Web文本挖掘关键实现技术做了介绍,最后讨论了Web文本挖掘的价值及其对Web发展的重要性。  相似文献   

11.
随着Internet上Web服务的快速增长,准确、高效地发现Web服务已经是Web服务技术中的难点和关键问题。文章提出基于用户兴趣的Web服务发现方法。首先介绍了对用户兴趣进行挖掘和建模的方法,然后论述了Web服务描述文档和用户兴趣特征之间的相关性分析过程,为得出满足用户兴趣的Web服务发现结果提供了一条可行的路径,提高了Web服务发现的准确度。  相似文献   

12.
为了使个性化推荐系统能适应用户浏览兴趣的变化,一个关键问题就是如何动态地更新用户的兴趣模型。提出了一种新的二层树状结构模型。模型的第1级节点表示用户的兴趣类型,及其对每一兴趣类的兴趣度高低:第2级节点是用户某一兴趣类的向量空间模型表示。并通过分析Web环境下用户的浏览速度,改进了兴趣类兴趣权值计算公式,然后通过用户在这张页面上的浏览速度和页面内容与兴趣类主题的相关程度来更新模型。试验表明改进的计算公式能将兴趣估计的一致性提高到70%。  相似文献   

13.
为了观察网络用户浏览行为以研究用户偏爱的浏览模式集和个人兴趣,本文采用频繁链表结合存取树的增量式结构,使用捕获的网络用户浏览轨迹构建、更新该结构并使用同类合并的思想挖掘该结构以获得用户偏爱浏览模式集。实验通过对比本算法与GSP算法在同一测试集上的更新和挖掘情况,证明本算法在准确度和效率上都大幅领先。同时,该算法也为后续的长期观察研究提供了理论基础。  相似文献   

14.
在现有的推荐系统中,基于用户兴趣模型都能够表达出用户的兴趣,但在用户兴趣发生变化时却不能够及时更新模型。提出基于用户反馈内容来实时更新用户兴趣的消息推荐系统,通过实时更新模型和特征向量进而得到用户当前最匹配的推荐结果。并使用HBase(Hadoop Database)作为存储,能更好地适应数据规模的增长。  相似文献   

15.
一种改进的基于浏览行为的用户兴趣模型   总被引:1,自引:0,他引:1  
主要讨论并建立了一种改进的基于用户浏览行为的用户兴趣模型,模型中综合考虑了Web用户对页面的浏览行为、对页面关键词的感兴趣程度、用户的短期兴趣和长期兴趣。在.NET平台下实现了WIPISES演示系统,在系统中嵌入本文所提出的改进的用户兴趣模型。仿真实验结果表明:使用本文改进的用户兴趣模型进行信息检索,其搜索效果优于目前主流的搜索引擎,而且Web用户的偏好性越强,WIPISES系统的优势也就越显著。  相似文献   

16.
To improve user experience of composite Web services, a user-aware quality of service (QoS) based Web services composition model is proposed. Under such model, a Web services selection method based on quantum genetic algorithm is proposed. This algorithm uses quantum bit encoding, dynamic step-length quantum gate angle adjustment, neighborhood service search and dynamic punishment strategy to expand search scope and speed up convergence. Simulation experiment shows that this algorithm is more efficient than other existing algorithms in Web services selection.  相似文献   

17.
We develop a conceptual framework for exploring significant differences in how people from diverse cultural backgrounds and with diverse individual characteristics might perceive and use Web documents. This is the first stage of a large multistage empirical study of user satisfaction and effectiveness of various Web designs based on cultural and individual factors. We identify six cultural factors and six individual factors that could impact the effectiveness of Web documents. The six cultural factors include: power distance, individualism versus collectivism, masculinity versus femininity, anxiety avoidance, long-term versus short-term orientation, and polychronic versus monochronic time orientation. The six individual factors include: demographics (age and gender), professional knowledge, information technology knowledge, flexibility, information processing abilities, and cultural knowledge. Based on the conceptual model proposed, we develop a number of testable, specific propositions on how Web document effectiveness could be impacted by the cultural and individual factors in various Web designs. In order to measure document effectiveness of each design, we identify components of Web document effectiveness as perceived usability, reliability, clarity, and comprehension that, in turn, influence readers' overall satisfaction with Web documents. Using the propositions presented, one can measure and analyze how cultural and individual factors influence users' satisfaction, which will assist researchers, educators, and communicators working with various Web designs  相似文献   

18.
To address the problem of extracting valuable information from massive Web pages in big data environments,a novel information extraction method based on node property and text content for massive Web pages was put forward.Web pages were converted into a document object model (DOM) tree,and a pruning and fusion algorithm was introduced to simplify the DOM tree.For each node in the DOM tree,both density property and vision property was defined and Web pages were pretreated based on these property values.A MapReduce framework was employed to realize parallel information extraction from massive Web pages.Simulation and experimental results demonstrate that the proposed extraction method can not only achieve better performance but also have higher scalability compared with other methods.  相似文献   

19.
Exploiting the Information Web   总被引:1,自引:0,他引:1  
The World Wide Web is an increasingly important data source for business decision making; however, extracting information from the Web remains one of the challenging issues related to Web business intelligence applications. To use heterogeneous Web data for decision making, documents containing relevant data must be located, and the data of interest within the documents must be identified and extracted. Currently, most automatic information extraction systems can only cope with a limited set of document formats or do not adapt well to changes in document structure, as a result, many real-world data sources with complex document structures cannot be consistently interpreted using a single information extraction system. This paper presents an adaptive information extraction system prototype that combines multiple information extraction approaches to allow more accurate and resilient data extraction for a wide variety of Web sources. The Amorphic Web information extraction system prototype can locate data of interest based on domain knowledge or page structure, can automatically generate a wrapper for a data source, and can detect when the structure of a Web-based resource has changed and act on this to search the updated resource to locate the desired data. The prototype Amorphic information extraction system demonstrated improved information extraction accuracy for the four different extraction scenarios examined when compared with traditional data extraction approaches  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号