首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
结合关联规则与模糊C均值聚类(Fuzzy C-Means,FCM)进行用户聚类,首先将用户访问事务集构造出页面关联矩阵,以此来计算用户浏览路径之间的相似程度,接着利用FCM算法对用户进行聚类.通过与传统聚类比较的实验证明,此方法是有效的且更符合实际.  相似文献   

2.
文章提出了一种基于ISODATA的用户访问路径聚类算法,根据用户的访问兴趣定义了相似性测量手段和聚类中心。在对Web站点的访问日志进行事务识别后,根据群体用户对Web站点的访问顺序进行聚类,则每一个聚类集反映出该聚类集中的全体用户具有相似的访问兴趣。  相似文献   

3.
基于兴趣度的Web用户聚类方法   总被引:1,自引:1,他引:0  
现有的Web用户聚类方法都是通过对用户喜好页面的访问模式分析来建立用户聚类,没有充分考虑时间意识、用户兴趣、用户访问模式之间的关系与影响.针对这一问题,在时间意识的Web用户聚类基础之上,提出了基于兴趣度的Web用户聚类方法.通过对日志文件中的用户访问模式进行分析,计算用户兴趣度.结合渐进遗忘算法,对用户兴趣爱好进行调整与更新,并在此基础上对用户进行聚类.实验表明,本方法能够更好地分析用户访问模式,更准确地计算用户兴趣,具有更好的聚类效果.  相似文献   

4.
用户兴趣空间的Web页面聚类   总被引:4,自引:1,他引:4  
文章基于日志挖掘,提出一种在用户兴趣空间中进行Web页面聚类的算法。算法的基础是用户访问频率矩阵A。A的行对应页面向量,列对应用户向量,A中元素是用户对页面的访问频率。对A中的行做聚类可以对页面进行相关聚类,对A中的列做聚类可以对兴趣相似的用户进行聚类。文章认为A中的这两种聚类是一对对偶问题。文章基于A和A中这两种聚类在权重之间的对偶关系,提出了用户兴趣空间的概念。用户兴趣空间突出了用户的共同兴趣,是一个正交空间。实验结果表明,与在A中直接做页面聚类相比较,用户兴趣空间中的页面聚类取得了较好的效果。  相似文献   

5.
由Jeh和Widom提出的SimRank算法是一种普适"结构相似度"计算模型。由于SimRank算法采用迭代方式计算图节点间相似性,因此时间复杂度和空间复杂度都非常高。随着数据量的激增,单机运算能力不能满足大规模数据的计算要求。本文提出了基于MapReduce计算模型的分布式SimRank算法,利用该算法对RDF图进行相似度度量,然后利用分布式的AP聚类算法对图节点进行聚类分析。实验结果表明,该方法能够高效的完成图节点的相似度度量,实现图的有效聚类。  相似文献   

6.
Web结构优化技术在降低访问延迟、提高访问效率上具有重要作用。由此提出根据用户访问路径建立Web层次模型(WHM),利用页面相似度合并同层相似页面,从而构建Web概念化模型(WCM)。实验及分析表明, WCM模型能够在适度聚类的情况下清晰地展现Web结构。此外,将WCM模型应用于预取系统,该模型所采用的聚类算法在预取效率方面明显优于传统方法,具有可行性和高效性。  相似文献   

7.
随着雷达技术与电子技术的不断发展,电子对抗环境日趋复杂.为能够在复杂电子对抗环境中进行实时有效的信号分选,提出了一种基于并查集的低复杂度模糊聚类信号分选算法.通过计算两脉冲间相似度,以相似度高于阈值作为集合归并条件,依次完成集合归并后查询并查集完成聚类结果输出.通过结合并查集与模糊聚类分选算法,大大降低了模糊聚类分选算法的复杂度,本文所提算法时间复杂度为O(n2),空间复杂度为O(n).由于该算法具有低复杂度的特点,可应用于工程项目.  相似文献   

8.
谱聚类算法通常是采用高斯核作为相似性度量,并利用所有可用的特征来构建具有欧氏距离的相似度矩阵,数据集复杂度会影响其谱聚类性能,因此该文提出一种基于公理化模糊子集(AFS)的改进谱聚类算法。首先结合AFS算法,利用识别特征来衡量更合适的数据成对相似性,生成更强大的亲合矩阵;再有效地利用Nystr?m采样算法,计算采样点间以及采样点和剩余点间的相似度矩阵去降低计算的复杂度;最后通过在不同数据集以及图像分割上进行实验,证明了提出算法的有效性。  相似文献   

9.
该文针对现有聚类算法在雷达信号分选应用中复杂度高,准确性低的问题,研究了一种基于锥面簇分配的支持向量聚类算法,该算法在数据空间进行簇分配,避免了特征空间中计算邻接矩阵带来的高复杂度问题。该文将此算法引入雷达信号分选中,并在此基础上对其进行改进,使改进后的算法能对异常值做进一步处理,以达到缩短消耗时间的同时提高正确率的目的。同时以信息熵的理论描述类内聚集度和类间分离度,应用相似熵指标验证分选效果的有效性。仿真结果表明,该方法在提高分选正确率的同时可以有效降低计算复杂度。  相似文献   

10.
基于网络用户行为的相关页面挖掘模型   总被引:11,自引:0,他引:11  
文章提出了一种基于网络用户行为的相关页面挖掘模型。模型采用统计的方法对proxy日志进行挖掘。模型的输入是一个WEB页面,输出是一组与之相关的页面。模型的假设基础是一组兴趣相似的人访问的页面有可能相关。模型从用户群中找出对输入页面感兴趣的用户,通过聚类从这些用户中找出一类具有相似兴趣背景且对输入页面最感兴趣的用户,综合这类用户感兴趣的页面,从中挖掘出与输入页面相关的页面。该模型与目前流行的相关页面检索算法的最大区别在于分析的对象是网络用户行为,因为模型认为页面是否相关的最终判定者应该是用户,通过分析网络用户行为能够更好地挖掘用户在页面相关判定上的潜在意识。用户对页面的兴趣度基于用户对页面的访问频率而定义。实验表明,该模型是可行的。该模型可用于改进传统的IR,提供相关反馈和查询扩展,使其更加适应Internet检索。该模型也可用于内容安全方面的相关主题预测。  相似文献   

11.
针对离散评分不能合理表达用户观点和传统协同过滤算法存在稀疏性等问题,借鉴年龄模糊模型,提出了梯形模糊评分模型。该模型将离散评分模糊化为梯形模糊数,考虑了评分模糊性和信息量,通过梯形模糊数来计算用户相似度,据此设计了协同过滤算法,并证明了该算法是传统协同过滤算法在模糊域的扩展。实验表明,该算法在数据稀疏且用户数远多于项目数时性能突出,并且算法运行时间远小于传统协同过滤算法。  相似文献   

12.
web服务发现模型是为了满足用户各种用途的web服务方式,以代码重入和松散耦合的方式以最优的组合实现可以提供用户需要的web服务模型。web服务发现模型是一种面向服务系统架构的一类基础性问题,但是又是解决用户不同需求十分有效的模型。通过对本体特性和发现模型的结构特点的研究,在本文中引入了本体解析的web服务标注算法和环境语义web发现模型。从而更好地实现web服务发现模型的选择用户所要求的服务的准确性,也为web服务的智能匹配做出了探索。  相似文献   

13.
在异构无线网络中,针对综合考虑网络端和用户端参数的垂直切换算法,参数权重难以确定,同时基于模糊逻辑的垂直切换算法存在复杂度高的问题,该文提出一种基于模糊逻辑的分级垂直切换算法。首先,将接收信号强度(RSS)、带宽、时延输入到1级模糊逻辑系统,结合规则自适应匹配,推理出QoS模糊值,并通过QoS模糊值对网络进行初步筛选得到候选网络集;然后通过触发机制触发2级模糊逻辑系统,并将候选网络的QoS模糊值、网络负载率、用户接入费用输入2级模糊逻辑系统,同时结合规则自适应匹配,得到输出判决值,从而选择最佳接入网络。最后,实验结果表明,该算法能保证网络性能的同时,降低系统的时间开销。  相似文献   

14.
The growth of the World Wide Web and web‐based applications is creating demand for high performance web servers to offer better throughput and shorter user‐perceived latency. This demand leads to widely used cluster‐based web servers in the Internet infrastructure. Load balancing algorithms play an important role in boosting the performance of cluster web servers. Previous load balancing algorithms suffer a significant performance drop under dynamic and database‐driven workloads. We propose an estimation‐based load balancing algorithm with admission control for cluster‐based web servers. Because it is difficult to accurately determine the load of web servers, we propose an approximate policy. The algorithm classifies requests based on their service times and tracks the number of outstanding requests from each class in each web server node to dynamically estimate each web server load state. The available capacity of each web server is then computed and used for the load balancing and admission control decisions. The implementation results confirm that the proposed scheme improves both the mean response time and the throughput of clusters compared to rival load balancing algorithms and prevents clusters being overloaded even when request rates are beyond the cluster capacity.  相似文献   

15.
基于主动学习和否定选择的垃圾邮件分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
胡小娟  刘磊  邱宁佳 《电子学报》2018,46(1):203-209
针对现在网络上泛滥的垃圾邮件问题,本文结合主动学习方法和否定选择算法提出了一种二类文本分类方法:主动否定学习算法.根据用户少量标注建立双向兴趣集,利用否定选择算法的自体异常检测机制改善主动学习中的采样策略,并将双向兴趣集作为检测器,新增样本集作为自体集,对两者进行异常匹配.本文算法与在线垃圾邮件快速识别方法、增强差异性的半监督协同分类算法、垃圾邮件过滤方法、基于人工高免疫的多层垃圾邮件过滤算法和在线主动多领域学习方法在六个常用邮件语料集上进行了分析比较,结果表明本文算法具有较高的准确率、召回率、分类精度,和较低的用户标注负担.使用用户个性喜好转换为双向兴趣特征的方式有助于提高算法的分类能力;利用异常检测匹配选取未知类别特征的方式,有效地降低了用户标注负担.  相似文献   

16.
A web album service allows a user to publish photo albums on the web and view albums of other users. Through broadband mobile telecom, users can enjoy watching contents of web albums at any place in real time. User experience on mobile web album is affected by the transmission delay of mobile network, which determines whether the user needs to wait to view the images. We propose a prefetching mechanism that enhances user experience on accessing mobile web albums. A transmission control protocol‐like sliding window protocol (of size N) is exercised, and when the buffer for the sliding window at the user equipment is full, prefetching is suspended. The buffer size N affects the prefetching performance. The larger the N value, the better the user experience. However, a large N value means that many images will be prefetched. If they are not actually viewed by the user, the network resources for transmitting these images are wasted. This paper proposes both analytic and simulation models to select the smallest N (the optimal N value) so that the expected user experience can be achieved. Copyright © 2014 John Wiley & Sons, Ltd.  相似文献   

17.
ISAPI(Intemet Server Application Programming Interface)是微软公司Web服务器IIS(Internet Information Server)上的一个API标准,论文研究了一种基于ISAPI过滤器的访问控制系统,能在对Web应用系统透明的情况下实现用户身份鉴别与访问控制,其一个特点是采用独立的Session维护,并支持基于cookie或URL重写传递用户Session ID。  相似文献   

18.
基于双因子认证技术的网络身份识别   总被引:5,自引:0,他引:5  
本文提出了一种基于动态双因子认证技术的网络身份识别方法,用户每次登录的口令是利用系统时间和用户ID通过MD5加密算法计算得到,其通过MD5加密后生成的登录口令是随机的,这将进一步提高开放网络环境下身份识别的可靠性和安全性。同时,本文还提出网络身份识别技术可以应用到各类网站的服务器上,用来完成对用户身份的识别,以提高网络系统的安全性。  相似文献   

19.
IMS域的位置管理策略研究   总被引:1,自引:0,他引:1  
UMTS(Universal Mobile Telecommunications System)R6中IMS(IP Multimedia Subsystem)域的用户的位置都要注册到归属地网络,而且终端的所有SIP信令都要经过注册服务器,导致用户在漫游状态下控制信令的迂回路径变长并限制了用户对网络中应用的使用.该文对UMTS R6的IMS位置管理方案进行了改进,提出了IMS用户位置信息的分布式管理和联系人位置信息自适应缓存机制,使得其漫游状态下的位置注册和呼叫建立过程更加迅速.分析及仿真显示:新的位置管理策略从网络信令花费上优于原位置管理策略.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号