首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 64 毫秒
1.
为了充分挖掘和应用电子商务网站中的教材评论信息,运用细粒度的情感分类算法对用户的在线评论进行分析,基于教材特征级的情感分析结果,辅助潜在客户和商家做出合理有效的决策.本文首先使用爬虫采集教材的在线评论文本,对其进行去噪、分词和词性标注等预处理;然后分析产品特征,在通用情感词典的基础上扩建领域情感词典;最后基于句法分析结果,结合教材评论的语言特性,设计适合教材评论的情感倾向性分析算法,并通过实验验证了算法的有效性.  相似文献   

2.
通过主题模型对酒店评论文本进行文本挖掘,有利于引导酒店管理者和客户对评论信息做出合适的鉴别和判断。提出一种基于预训练的BERT语言模型与LDA主题聚类相结合的方法;利用中文维基百科语料库训练BERT模型并从中获取文本向量,基于深度学习算法对评论文本进行情感分类;通过LDA模型对分类后的文本进行主题聚类,分别获取不同情感极性文本的特征主题词,进而挖掘出酒店客户最为关注的问题,并对酒店管理者提出具有参考价值的建议。实验结果表明,通过BERT模型获取的文本向量在情感分类任务中表现较好,且BERT-LDA文本挖掘方法能使酒店评论文本的主题更具表达性。  相似文献   

3.
提出一种基于文本特征的专门面向酒店评论领域的情感分析模型,通过构建酒店评论领域专用情感词典,并结合酒店评论的句式特征、语法特点,解决了通用情感分析模型应用在酒店评论领域时,情感匹配不全面,情感值计算不精确等问题.本文实验结果表明,基于文本特征的情感分析模型能对酒店评论情感分析取得较好的分类效果.  相似文献   

4.
针对在线评论情感分析的复杂特征抽取问题,提出一种基于粗糙集的在线评论情感分析模型。分析传统词袋性特征,指出固定搭配特征在情感极性判别中的作用,采用粗糙集方法挖掘在线评论中的固定搭配特征,将其融合于SVM与Naive Bayes等情感分析模型中。实际酒店的在线评论情感分析结果表明,增加粗规则后,SVM模型与Naive Bayes模型获得的评论情感判别精度都有所提高。  相似文献   

5.
随着信息技术发展和社交平台多方面渗入,在线评论凭借真实客观的优点已成为商家和消费者的主要信息来源。结合TF-IDF、K-means算法获取酒店顾客满意度影响因素;采用基于监督学习的分类算法与百度自然语言处理API得出情感极性值;利用多元线性回归建立满意度评估模型,并将该模型应用于“2019哈尔滨冰上冰雪嘉年华”期间754家酒店的满意度分析中。研究结果表明:与现有酒店预订平台相比,该评价体系更加客观全面,顾客对此阶段的酒店总体满意度中等偏上,单维度分析中,总体感受是顾客最为关注的问题,但是酒店设施和卫生环境等因素也会影响酒店顾客满意度的提升。  相似文献   

6.
挖掘中文网络客户评论的产品特征及情感倾向*   总被引:17,自引:2,他引:15  
为探索中文客户评论中的产品特征及相关情感倾向的挖掘,以帮助生产商和服务商改进产品、改善服务,提高竞争力,提出采用基于Apriori算法的非监督型产品特征挖掘算法,结合监督型情感分析技术,实现对于评论中产品特征及其情感倾向的综合信息挖掘;并根据用户的关注权重将产品特征和情感倾向进行排列。采用几种从互联网下载的真实产品评论语料,对该方法进行了数据实验,实验结果初步验证了该方法的有效性。  相似文献   

7.
高华玲  张晶 《软件》2021,(1):45-47,66
为研究高端酒店服务中的亮点和不足,分析酒店用户评论舆情,文章对高端酒店用户评论进行情感分析和可视化,提出酒店优势与改进策略。文章采用通用情感词典Hownet与酒店评论相关的评论领域专业词典相结合的方式构建领域情感词典。结合所构建的领域情感词典和其他特殊词典,比如短语词典、否定词词典和副词词典等进行情感分类,然后将分类完成的三个极性的情感词进行词频统计和词云绘制,最后根据词云结果,给出高端酒店在经营策略上的改进建议。  相似文献   

8.
首先针对公共情感词典对专业领域适用性较低问题,以公共情感词典作为种子情感词典,以评论语料库中未出现在公共情感词典中的形容词作为候选情感词,在此基础之上利用点互信息理论构建专业领域的情感词典。其次针对在线评论情感分类问题,利用复杂网络理论提出了一种新的情感分类特征选择算法,改进了传统特征选择算法忽略特征语义相关信息,遗漏评论情感资源的问题。通过构建候选特征词关系网络,利用复杂网络节点重要性理论,考虑节点的局部和全局重要性,提出了利用网络节点的度中心性、介数中心性和接近中心性综合衡量节点重要性来选择情感分类特征的算法NTFS(Complex network feature selection)。最后以iPhone手机的在线评论为实验数据,利用SVM、NNET、NB分类器对比了NTFS、GI、CHI传统特征选择方法,实验证明NTFS在分类性能上优于GI,CHI算法。  相似文献   

9.
在评论数据上采用情感分析方法,研究酒店用户满意度的影响因子,可以为酒店管理者提供及时建议,改进酒店管理的效能。针对目前酒店评论数据分析方法没有进行细粒度情感分析的问题,提出一种融入Word Embedding特征的分类方法,有效地对评论数据进行细粒度分类。通过基于词典的情感分析方法对酒店评论进行极性判断,从而获得用户对酒店服务的细粒度情感评价。该方法能让酒店管理层快速全面了解酒店服务质量情况,有效提升了酒店管理效率。在大规模实际酒店评论数据上进行实验,结果表明了该方法的有效性。  相似文献   

10.
论文以酒店在线评论数据为研究对象,对酒店在线评论数据的特征挖掘进行了研究。论文首先从酒店在线评论数据的获取出发,经过数据清洗、词性分析、特征抽取、指标确定、特征筛选、特征确定、特征校验几个环节,实现了酒店在线评论数据特征挖掘的目的。论文以词频为基础,融合了词性分析、聚类分析等方法,利用词频数(TF)、词频率(TF1)、词频权重(TTW)、评论频率(DF)、逆文档频率(IDF)和TF1-IDF等指标对候选特征词进行降维,得出酒店在线评论数据的特征,并对特征词进行校验,完成了酒店在线评论数据的特征挖掘的过程。论文将为以评论为依据的客户分类、酒店分类、智能推荐奠定基础。  相似文献   

11.
基于JSP分页技术的研究   总被引:1,自引:0,他引:1  
电子商务应用中的数据量往往非常大,甚至会达到几十万到几千万条记录的规模,将如此大量的数据显示在一个页面里困难大、效率低。在这种情况下就需要采用分页显示技术将数据库中符合条件的数据逐页显示给用户。对JSP分页技术进行比较,在分析JSP分页技术特点的基础上,提出一种有效的分页解决方案,同时对分页技术的优化进行阐述。  相似文献   

12.
空间信息的存储和处理问题是地理信息系统(GIS)的核心问题.对空间数据和属性数据的统一存储管理已成为必然趋势.本文通过对GIS中海量数据的存储方式进行研究,指出对象-关系型的数据库存储方式是空间数据库的发展方向.在此基础上讨论了Hibernate技术与GIS数据库的结合,使用Hibernate技术将关系数据库中空间数据和属性数据进行封装,屏蔽了数据库底层操作,使得程序员可以用面向对象的思想随意操纵数据库,在利用了关系数据库的快速检索、查询能力的同时也增强了数据的一致性和可移植性.  相似文献   

13.
针对区块链上存在的欺诈账户给交易带来的安全问题,提出了基于机器学习的欺诈账户的检测及特征分析模型,将以太坊上真实的链上数据进行特征提取后作为模型的数据来源,通过对不同的机器学习方法进行比较得到最优模型并进行迭代训练以获得最佳的预测模型,同时引入 SHAP值对数据特征进行分析。实验结果表明,基于XGBoost的欺诈账户检测模型在RMSE、MAE和R2三组指标上达到了0.205、0.084和0.833,优于其余的对比模型,并结合SHAP值识别出预测欺诈账户的关键因素,为区块链的交易安全提供决策参考。  相似文献   

14.
机内测试(Built-In-Test,BIT)技术是改善系统或设备测试性和维修性的重要途径。在对弹载计算机BIT技术特征进行研究的基础上,提出了弹载计算机BIT设计的基本准则,提供了一种典型的弹载计算机BIT设计方法,经实践验证该设计方法适用于多种类型的弹载计算机设备,故障检测率不低于90%,故障虚警率不超过2%,显著地提高了弹载计算机的可靠性、可测试性及可维护性。  相似文献   

15.
为了解决唇语识别中唇部特征提取和时序关系识别存在的问题,提出了一种双向长短时记忆网络(BiLSTM)和注意力机制(Attention Mechanism)相结合的深度学习模型。首先将唇部20个关键点得到的唇部不同位置的高度和宽度作为唇部的特征,使用BiLSTM对唇部特征序列进行时序编码,然后利用注意力机制来发掘不同时刻唇部时序特征对于整体唇语识别的不同权重,最后利用Softmax进行分类。在公开的唇语识别数据集GRID和MIRACL-VC上与传统的唇语识别模型进行实验对比。在GRID数据集上准确率至少提高了13.4%,在MIRACL-VC单词数据集上准确率至少提高了15.3%,短语数据集上准确率至少提高了9.2%。同时还与其他编码模型进行了实验对比,实验结果表明该模型能有效地提高唇语识别的准确率。  相似文献   

16.
基于SVG的WEBGIS的研究   总被引:6,自引:0,他引:6  
为了更加适合网上地理信息系统的发布 ,介绍了 SVG作为发布 WEBGIS的一种方法 ,研究了如何用SVG进行地理空间数据的表示、存储和客户端的实现。研究表明 :SVG具有可扩展、可交互、基于 XML和开放标准等特点  相似文献   

17.
For given two sets of locks, the corresponding problems on mathematical safes are formulated on graphs. In the first set, all the locks have the same number of sates and, in the second set, any pair of locks can consist of different numbers of sates. A number of conditions are obtained under which there exist solutions to these problems for safes specified on directed or undirected single graphs such as a path, a chain, a cycle, and a star. __________ Translated from Kibernetika i Sistemnyi Analiz, No. 5, pp. 14–21, September–October 2006.  相似文献   

18.
陈冬英  宋东  陈杰 《测控技术》2015,34(1):91-94
航空电子全双工交换式以太网(AFDX)是成功应用于新一代大型飞机的新型航空数据总线.针对AFDX适航性及网络容错性能研究的需要,开展了有关AFDX网络故障注入方法的研究.在AFDX实验系统上,通过软件方法进行动态故障注入,测试AFDX网络对注入故障的响应,验证了AFDX网络的可靠性、健壮性及容错性能,并为进一步研究AFDX网络性能及故障诊断提供了大量测试数据,对深入开展AFDX适航技术研究打下了基础.  相似文献   

19.
面向Web的文本挖掘技术研究   总被引:4,自引:0,他引:4  
徐妙君  顾沈明 《控制工程》2003,10(Z1):44-46
简要介绍了文本挖掘技术,并描绘了该技术在Web应用特别是信息检索技术中的重要性.再对整个文本知识挖掘过程所涉及的各个方面进行了进一步地研究探讨,包括了文本特征的建立、特征提取、特征匹配、特征集缩减和模型评价等几个方面.其间运用数据挖掘技术对各个过程进行处理,并引进基于评估函数的特征筛选算法、词频矩阵、余弦计算法和潜在语义标引等方法来处理文本挖掘过程所产生的问题.在此基础上得出了一个完整的Web文本挖掘过程.最后展望了文本挖掘技术在Web应用中的前景.  相似文献   

20.
 A criterion when a subset of an MV-algebra is contained in the range of a (finitely additive) observable is given. It is used to prove that every at most countable subset of any MV-algebra is contained in the range of an observable. A much stronger result holds for any bold fuzzy algebra [0,1] S , which is whole contained in the range of a (σ-additive) observable.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号