首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
在线评论挖掘是从大量的在线评论数据中挖掘出有用的信息以支持管理决策的过程。本文首先介绍了在线评论挖掘的意义、任务以及半监督学习的基本概念,并给出了半监督学习在在线评论挖掘中的应用模型。  相似文献   

2.
通过主题模型对酒店评论文本进行文本挖掘,有利于引导酒店管理者和客户对评论信息做出合适的鉴别和判断。提出一种基于预训练的BERT语言模型与LDA主题聚类相结合的方法;利用中文维基百科语料库训练BERT模型并从中获取文本向量,基于深度学习算法对评论文本进行情感分类;通过LDA模型对分类后的文本进行主题聚类,分别获取不同情感极性文本的特征主题词,进而挖掘出酒店客户最为关注的问题,并对酒店管理者提出具有参考价值的建议。实验结果表明,通过BERT模型获取的文本向量在情感分类任务中表现较好,且BERT-LDA文本挖掘方法能使酒店评论文本的主题更具表达性。  相似文献   

3.
酒店在线评论细粒度挖掘具有重要研究意义.以酒店在线评论具体特征属性和情感分类为研究目标,应用Apfiori算法和情感词典匹配算法,对重庆雾都宾馆在线评论数据深入挖掘,挖掘出用户最关注的酒店十大特征和满意度结果,进一步挖掘出商务出差等五种不同出游类型人最关注的酒店五大特征和满意度结果.这种方法不仅能对酒店领域评论进行分析,同样能够应用于其他领域.  相似文献   

4.
在线评论中特征抽取是产品意见挖掘的基础,直接影响到最终挖掘结果的准确性。针对现有特征抽取方法的准确率和召回率偏低问题,该文通过设计词性序列模板产生候选特征集,利用PMI-IR方法进行筛选,最终获得产品特征集。实验结果表明,该方法取得较好效果。  相似文献   

5.
以竞争市场环境中的产品在线评论数据为研究对象,基于支持产品设计改进的视角,采用数据挖掘的方法与工具,开展面向产品设计改进的在线评论大数据分析研究。重点开展在线评论数据挖掘过程模型中的有用性建模和特征评价值情感分析。以某智能手机产品的在线评论数据为对象进行了实验,得到该产品各个属性的评价值,与更新换代后的产品属性进行比较,验证了此方法的有效性。  相似文献   

6.
由于当前已有方法考虑警务特征挖掘问题,导致警务体能训练结果不理想。为了有效解决上述问题,提出一种基于大数据技术背景下警务体能训练方法。将警务人员的体能测试数据作为研究对象,通过关联规则技术分析测试项之间的关联,同时进一步优化提升测试指标,挖掘警务体能特征。在大数据技术背景下,通过警务体能特征提取结果,针对不同的警务人员,分别给出不同的体能训练方法。仿真实验结果表明,所提方法能够有效提升警务体能,获取满意的警务体能训练结果。  相似文献   

7.
近年来,人们对于酒店的需求与日俱增。但面对形形色色的酒店服务,如何选择的问题日益突出,精准合理的个性化酒店推荐拥有极大市场。已有的传统推荐技术及其推荐系统,没有从内生性参数分析和解释用户行为,在用户兴趣点发掘的精确性以及数据稀疏情况下的推荐存在局限。对此提出一种面向酒店的人性化用户建模与推荐方法。根据所在实验室提出的数字灵魂模型,将其映射到酒店领域,得到人性化酒店用户模型。计算用户偏好与酒店特征间的相似度,并结合基于协同过滤的推荐技术,得出推荐候选集。以"酒店管理营运博弈沙盘"为实验平台,该沙盘是由所在实验室研发并已被数十家酒店管理院校使用的电子学习软件。实验结果表明,相比于单纯的特征参数匹配和普通的协同过滤,该方法拥有更高的准确率、召回率和运行效率,并在一定程度上解决冷启动和数据稀疏的问题。  相似文献   

8.
银行信用卡分类挖掘数据的预处理   总被引:9,自引:0,他引:9  
翟凌慧  马少平  唐焕玲 《计算机工程》2003,29(11):195-196,F003
描述了信用卡数据分类挖掘中的数据预处理过程,先从纷杂的应用数据中选择与分析主题有关的数据表,经过一系列数据库操作,从这些数据表中获得样本的输入信息,然后从交易历史信息中抽象出对样本分类的相关参数,将分类标准量化后得到对样本的分类。最后经过数据规格化、异常处理、缺失处理等数据清理方法对样本数据进行加工,得到分类挖掘所需的样本数据。  相似文献   

9.
互联网上电商中存在着海量的评论信息,这些信息蕴含了重要的价值信息,一方面反映了用户对产品的评价,另一方面用户可以通过浏览评论信息决定是否购买。针对从海量的信息中挖掘重要信息,本文提出了通过LDA模型对评论信息中特征进行挖掘的方法。实验表明该方法能够有效的挖掘特征。  相似文献   

10.
“去繁存精”的光谱数据解耦方法可去除高维光谱数据的大量冗余,提炼其特征谱段,是光谱仪器得以广泛应用的重要基础。应用各异性和光谱特征优选方法普适性所构成的矛盾,在一定程度上制约了光谱仪 器的应用。本文提出了序列前向选择(Sequential forward selection,SFS) 的光谱特征自适应数据挖掘方法,生成最优变量组合作为支持向量机(Support vector machine,SVM)分类模型的输入,在对光谱数据降维的同时,实现了高精度的数据分类。本文方法可有效解决大量光谱数据的多类分类问题,并在红木分类中得到了实际验证和应用,为破 解因光谱特征峰高度混叠而难以进行主观经验特征选择的困境提供了新思路。  相似文献   

11.
宁建飞 《计算机时代》2015,(3):30-32,35
提出了一种面向个性化网络学习的学习者个性挖掘(Personality mining)及自适应学习策略生成的解决思路,即:通过对样本学习者的个性调查和学习行为模式的分析,挖掘出“行为模式-个性-学习策略”三者之间的关联关系,并据此实现学习者个性的自动获取与自适应学习策略的生成,为学习者提供网络学习的策略推荐。  相似文献   

12.
基于贝叶斯分类的网上书店潜在用户挖掘   总被引:1,自引:0,他引:1  
以网上书店为例,利用贝叶斯分类预测技术,进行了发现潜在客户群体的研究,用随机选取的10组样本进行试验预测,预测准确率达96.5%,表明了该算法是有效的。  相似文献   

13.
特征选择一直是机器学习和数据挖掘中的一个重要问题。在多标签学习任务中,数据集中的每个样本都与多个标签相关联,标签与标签之间通常也是相关的。在多标签高维数据分析中,为降低特征维数和提高分类性能,研究者们提出了多标签特征选择方法。系统综述了多标签特征选择的研究进展。在介绍多标签分类以及评价准则之后,详细分析了多标签特征选择的三类方法,即过滤式算法、包裹式算法和嵌入式算法,对多标签特征选择未来的研究提出展望。  相似文献   

14.
近年来,将模糊集理论应用到数据挖掘研究中成为数据挖掘领域的一个研究热点。为追踪其研究进展,探讨未来的研究方向,对模糊集理论在数据挖掘中的主要研究方向(聚类分析、关联挖掘、分类)进行了综述,主要阐述数据和模式的表示、模式相似性计算等关键问题。可以看出,充分利用模糊论强大的模糊数据建模功能,并且与其它智能化处理技术相结合,是当前这一领域研究的主流技术。指出了存在的若干问题,并对研究前景进行展望。  相似文献   

15.
分类问题的一种可伸缩特征选择算法   总被引:4,自引:0,他引:4  
张巍  邹翔  吴晓如 《计算机学报》2005,28(7):1223-1229
特征选择是数据挖掘分类中的一个重要问题.该文推导出一种新的衡量特征与类别相关度的测度SCD即描述特征取值序列类分布的CV系数,利用该测度给出一种线性的可伸缩特征选择算法StaFSOS,并证明了在类别数为2时,SCD测度满足分支界限法的单调性;给出了StaFSOS的一个完备形式——BBStaFS.在12个标准数据集中,StaFSOS算法得出的结果和目标集几乎一致,而StaFSOS的效率高于其它算法;而在另1个中,BBStaFS算法得出了准确结果.在用1000个样本20个特征的真实数据进行的测试中,StaFSOS运行时间是目前较快的GRSR的1/2,得出的特征集准确有效.  相似文献   

16.
针对银行全成本分析的业务特点和数据挖掘各种算法的应用特征,提出了基于关联规则的分类算法在银行全成本分析系统中的分析模型.将此模型与其他机器学习分类算法进行实验比较,得出此算法在该领域的最佳效果,所挖掘出的规则得到银行工作人员的肯定.  相似文献   

17.
以往针对通信网络故障分类的算法没有考虑告警和故障数据中的潜在特征,导致故障分类准确率低,因此提出一种基于数据挖掘的通信网络故障分类算法。首先,根据对数据背景和数据特点的理解,使用特征构造挖掘数据中潜在的特征,将挖掘到的特征加入原数据中。然后,使用LightGBM算法的特征重要性评估函数对新数据集中的所有特征进行重要性评估,根据重要性值删除不重要特征。最后,使用集成学习模型对特征筛选后的数据集进行故障分类研究。实验结果表明,基于数据挖掘的通信网络故障分类算法的准确率有更好的效果。  相似文献   

18.
根据用户访问网格资源的历史信息,采用分类算法对此信息进行挖掘,得出用户使用集群资源的访问规则和模式,在此基础上构造一种基于分类挖掘的资源调度模型、用户调度UA算法以及资源调度CDMRA算法,分别将用户请求调度到各个集群中闲置的CPU资源.实验证明,采用基于分类挖掘的资源分配策略相比其他算法可以减少资源分配过程中对资源的重新分配次数,可以提高网格资源的利用率.  相似文献   

19.
近年来微博中出现一些炒作账户采用违规手段开展网络公关活动,严重扰乱了正常的互联网秩序,然而传统炒作账户识别方法主要依靠人工分析,其效率低下且不适用于对海量账户进行识别。针对上述问题,提出一种改进的微博炒作账户识别方法,从账户状态、历史微博以及账户邻居3个方面对炒作账户的特征进行分析,构建炒作账户特征集,并利用数据挖掘中的朴素贝叶斯、支持向量机及K最近邻分类等算法对正常账户和炒作账户进行自动分类。实验结果表明,该方法能有效识别微博中的炒作账户,准确率高达95%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号