首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
潘志方 《计算机科学》2007,34(6):214-215
随着电子商务的不断发展,用户的分析和分类对电子商务网站来说越来越重要。因此需要一个行之有效的方法来进行用户分类并对其进行个性化服务。在本文中,我们提出了一种可以根据用户的网页访问记录和网上交易记录来动态地对顾客进行分类的方法,主要是利用了改进型的朴素贝叶斯分类器,对用户在网站上的行为进行分类,从而得到用户的分类信息,其结果可以作为提供个性化服务的依据。文章通过实验证明了上述方法的有效性和正确性。  相似文献   

2.
《软件》2017,(7):97-102
根据用户观看的视频时长与视频的实际时长信息来计算用户对该视频的喜好度,在spark内存计算框架下,以喜好度作为特征项,使用朴素贝叶斯,TF-IDF和改进了的TFC-IDFC分类算法,对视频用户属性进行分析,建立用户年龄区间的分类模型。此分类模型适合视频网站运营商将信息准确的推荐给用户,同时可提高信息的利用率。考虑到传统的TF-IDF算法没有体现特征项在类内和类间的分布特点,提出了改进的TFC-IDFC算法,通过正确率和F1值两个指标对以上三种分类算法的评价,证明了加权的分类算法比不加权的算法分类效果更好,改进的TFC-IDFC算法比传统的TF-IDF算法效果更优。  相似文献   

3.
为了降低网站分类处理的计算量和使分类结果能够反映用户的行为规律,将URL前缀相同的网页合并为一个处理单位,并从用户的HTTP访问行为中提取用于网站分类的特征,最后针对省级区域性网络数据规模大的特点,采用可伸缩性决策树算法,从河南省教育科研计算机网用户访问的网站中提取出新闻类网站、资源共享类网站和通讯类网站.该方法与传统的网站分类方法相比,不需要逐个分析网页内容,适合处理大规模数据.  相似文献   

4.
针对垃圾邮件过滤过程中分类模型难以个性化、难以适应用户兴趣动态变化的问题,提出了一种基于用户行为的邮件分类算法。通过分析朴素贝叶(NB)斯分类算法的原理,改造朴素贝叶斯算法,使其具有动态调整能力。邮件服务器接收到新邮件后自动进行分类判别,用户浏览邮件的过程中对邮件进行操作,根据用户对错分邮件的处理自动将该邮件加入训练数据集,并动态更新相应特征的统计概率,使邮件分类算法能够依据用户对不同邮件的操作行为动态调整分类模型,以达到有效过滤垃圾邮件的目的。与常用的贝叶斯分类算法的实验比较表明在给定小样本集合进行训练的情况下,新算法对于垃圾邮件的识别率比传统的朴素贝叶斯方法、基于风险敏感的朴素贝叶斯方法等提高了10%,获得了较好的分类性能。  相似文献   

5.
研究SVM算法在中文网站顶级类别分类中的应用,并提出一个网站向量模型的生成算法.该算法以网站的首页HTML代码为基础,通过代码清理、内容提取、分词等步骤生成向量模型作为SVM的输入,并采用多类的线性SVM分类器进行分类.最后对这个算法进行了实现,通过实际的网站数据测试,分析了实验结果,证实了这个算法能够取得较高的分类准确率并表明了在低流量低延时状态下网站分类系统的可行性,为其进一步在客户端或游览器中的应用提供了实验基础.  相似文献   

6.
基于模糊角分类的神经网络用户兴趣模型分类算法   总被引:1,自引:0,他引:1  
王秀丽  罗方芳  宁正元 《计算机应用》2006,26(10):2437-2439
用户兴趣描述文件的快速分类是个性化搜索引擎的关键技术,提出了一种模糊角分类神经网络模型,该模型能接受用户兴趣描述文件的实向量输入,克服了角分类神经网络(CC4)对二进制输入的要求。模糊角分类神经网络模型根据用户信息所落入的k最近邻的样本泛化空间来进行分类,随着k值的增大,其分类效果趋近于贝叶斯分类算法。  相似文献   

7.
钓鱼网站的主要手段是采用群发垃圾文件,欺骗用户在钓鱼网站URL地址,登陆并输入个人机密信息的一种攻击手段。本文通过分析钓鱼网站URL地址的结构和词汇特征,对出现异常的钓鱼网站URL进行预测。将钓鱼网站URL地址中抽取的结构特征,词汇特征等,采用数据挖掘的方法进行预测。本文使用四种分类算法,决策树、随机森林、KNN、SVM算法对数据进行分类预测。  相似文献   

8.
了解用户的兴趣是电子商务网站实现个性化的基础,该文提出了一种分析用户兴趣度的新方法,该方法首先根据网站主索引页上的超链接将网站上的网页模糊分类,并通过对Web日志的统计,得出各交叉页的模糊度,然后综合考虑用户浏览网页的时间长度、点击网页的次数,利用模糊综合评判得出用户对于各网页分类的兴趣度,再与各网页分类的平均兴趣度水平作对比,从而发现用户的兴趣所在,实验表明该方法是有效的。  相似文献   

9.
近年来,随着大数据分析需求的急剧增长,分类算法的运用也越来越广泛,如何为用户选择适用的分类算法成为数据挖掘技术在应用上亟待解决的难题。相关研究表明,同一算法在相似数据集上具有相近的分类效果。根据这一理论,构建基于数据集相似性的分类算法选择模型。首先采用数据集离散化方法来对数据集进行特征提取,构建样本库,然后结合邻近相似的原则为数据集推荐合适的分类算法。通过UCI数据集上的算法实验,结果表明大多数情况下推荐得到的分类算法具有良好的性能。  相似文献   

10.
社交网络经常通过掌握的用户信息来对其进行好友推荐。这种好友推荐带来了技术挑战,现有的好友推荐技术并不能有效解决该问题。为了应对这种技术挑战,拟提出基于分类属性的好友推荐算法。通过机器学习的手段,分析出不同类型的属性对用户行为的贡献度不同,将其进行分类处理。基于该分类,提出的算法可以在掌握用户基本资料以及近期行为的基础上,搜索出与之相关性更强的好友或能够引发其兴趣点的商品,用来快速、准确、全面地得到用户与其好友之间亲疏程度排序及分类的结果。实验结果证明了所提出方法的有效性及高效率。  相似文献   

11.
随着客户关系管理系统的不断发展和应用,使用先进的算法进行客户分析变得越来越重要。尤其是象银行这种以客户为导向的行业,客户分析是十分必要的。当前,支持向量机方法作为一种统计学习理论的分类方法已经发展的比较成熟而且成功应用到了很多领域。文章解决的主要问题是对银行的客户数据根据其属性对客户进行分类,为银行的客户关系管理系统提供一种可靠的分类方法。文中主要介绍了银行的客户分类学习的过程和结果,如,客户数据清洗,数据预处理,SVM进行数据分类,多类分类处理,客户属性选择等问题。  相似文献   

12.
本文采用决策树方法,对客户交易数据和客户基本信息进行数据挖掘分析,降低了数据冗余度,提高了数据集准确率。在RFM模型基础上,从客户交易信息中选取了购买频率和平均每次购买金额作为分类评估指标的补充,得到一组客户交易数据训练集。结合J48算法使用WEKA算法对客户交易数据训练集进行训练、测试和验证,构建了客户分类决策模型,从而有利于客户分类原型系统的系统分析和系统设计。  相似文献   

13.
电信业的客户投诉不断增多而又亟待高效处理。针对电信客户投诉数据的特点,提出了一种面向高维数据的改进的集成学习分类方法。该方法综合考虑客户投诉中的文本信息及客户通讯状态信息,基于Random Subspace方法,以支持向量机(Support Vector Machine,SVM)为基分类器,采用证据推理(Evidential Reasoning,ER)规则为一种新的集成策略,构造分类模型对电信客户投诉进行分类。所提模型和方法在某电信公司客户投诉数据上进行了验证,实验结果显示该方法能够显著提高客户投诉分类的准确率和投诉处理效率。  相似文献   

14.
为了克服现有客户分类方法在假设前提、准确度、泛化能力等方面的不足,提出了一种F-scores和SVM算法相结合的客户分类方法,并把该方法应用到银行信用卡客户分类问题中予以验证.实证分析表明:该方法最终的模型验证准确率可达95%以上,学习和分类能力良好.  相似文献   

15.
顾客作为产品满意度测度过程中评价决策的主体,对其进行分类研究,识别不同顾客群体异质评价特征具有重要意义。顾客评价特征存在多元性和冲突性,根本原因是顾客作为决策者的异质性,而顾客的异质性来源于顾客本身属性,包含分类型属性和数值型属性。提出了一种基于惩罚竞争机制的混合属性顾客分类方法,根据数值型和分类型属性值的分布规律,给出了混合数据初始聚类中心的确定方法;建立了统一相似性度量模型,并引入惩罚竞争机制,实现了聚类过程中的基本迭代和自动优化聚类数。以某产品异质顾客分类问题为例验证了所提方法的可行性,继而通过“Heart Disease”标准数据集将所提算法与K-means和K-prototypes两种经典聚类算法进行对比,验证了该方法的有效性。  相似文献   

16.
利用数据库技术实现的可扩展的分类算法   总被引:9,自引:0,他引:9  
刘红岩  陆宏钧  陈剑 《软件学报》2002,13(6):1075-1081
重点研究将数据挖掘中的分类技术与数据库技术紧密结合的高效的可扩展的分类算法.提出一种基于分组记数技术构造分类器的方法,利用数据库系统的结构化查询语言来实现主要计算任务.为了提高算法的执行效率,还提出了优化策略和冗余规则的剪裁策略,并将分类规则的发现过程与相关属性的选择方法有机地结合在一起.使用这些方法和策略,分类算法能够从大规模数据集中快速地发现一组简洁的规则.除了具有与现有分类算法相当的准确度和较高的执行效率以外,该分类算法还具有良好的基于训练集元组个数和属性个数两方面的可扩展性和易于实现的特点.  相似文献   

17.
On the Web, where the search costs are low and the competition is just a mouse click away, it is crucial to segment the customers intelligently in order to offer more targeted and personalized products and services to them. Traditionally, customer segmentation is achieved using statistics-based methods that compute a set of statistics from the customer data and group customers into segments by applying distance-based clustering algorithms in the space of these statistics. In this paper, we present a direct grouping-based approach to computing customer segments that groups customers not based on computed statistics, but in terms of optimally combining transactional data of several customers to build a data mining model of customer behavior for each group. Then, building customer segments becomes a combinatorial optimization problem of finding the best partitioning of the customer base into disjoint groups. This paper shows that finding an optimal customer partition is NP-hard, proposes several suboptimal direct grouping segmentation methods, and empirically compares them among themselves, traditional statistics-based hierarchical and affinity propagation-based segmentation, and one-to-one methods across multiple experimental conditions. It is shown that the best direct grouping method significantly dominates the statistics-based and one-to-one approaches across most of the experimental conditions, while still being computationally tractable. It is also shown that the distribution of the sizes of customer segments generated by the best direct grouping method follows a power law distribution and that microsegmentation provides the best approach to personalization.  相似文献   

18.
在高校就业信息化建设中,对进入高校招聘毕业生的企业客户进行等级分类和预测能够有效帮助高校管理者评估与该企业的合作效用,推动大学生就业信息化服务向更具针对性的个性化推荐方向发展。目前该问题的解决方案大多基于从业人员的主观经验判断,缺乏完善的定量分析模型。抽取某高校教育管理信息系统中与进校招聘企业客户相关的数据样本,并借助BP神经网络模型搭建有效的数据分析模型,使用训练样本数据训练模型从而确定分析模型中各节点参数,将训练后的分析模型用于预测测试样本集得到最终的性能指标,最后将该模型的分类性能与当前同类问题的其他解决方案进行比较。对比结果显示,基于BP神经网络模型的分类方式在预测准确度和精度方面明显优于其他现有模型。该研究成果能够在信息化平台中为该问题提供高效的解决方案,帮助高校就业工作管理者及服务人员依靠该模型对进校招聘企业做出快速精准的客户等级预测,为高校就业服务工作决策提供支持。  相似文献   

19.
为了解决95598客服投诉工单的整理、归档等问题,其中包括:在人工进行归档的过程中出现的疏忽造成的归档随意问题,即归档准确性问题;人工对投诉工单进行差错点归纳的耗时问题,即效率问题;人工对客服投诉分析深度不足,无法精准快速定位用户诉求热点的问题,即深度问题。本文针对以上三个问题给出解决方案,采用word2vec和XGBoost相结合的方式达到对95598客服投诉工单精准归纳。在文本词向量化的过程中采用word2vec方法,得到单词的文本词向量;利用XGBoost算法对95598客服投诉工单进行分类归档,并且对历史投诉工单的责任部门、专业分类、诉求事件、差错点四个方面进行标注。该模型的分类准确率在83%-91%左右,有较好的的效果。基于工单分类的结果,并设计了相关的投诉类看板,更直观的对数据进行展示。  相似文献   

20.
面对电信市场竞争的日益加剧和信息技术的迅猛发展,电信运营商必须建立以“客户为中心”的管理模式。将客户进行分类,针对不同的客户,研究出相应的营销策略。数据挖掘中的K—means聚类算法能对大型数据集进行高效分类。对K—means算法进行改进,使其能够应用于复杂的电信客户关系管理,实现更加准确和全面的客户分类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号