共查询到20条相似文献,搜索用时 62 毫秒
1.
体验经济时代的到来,民宿的出现满足了游客的个性化需求,促使住客发表民宿体验情况以表达情感。通过运用poikit获得江西省内民宿的信息,并把信息传入Arcgis和江西省矢量地图叠加,并进行分析。运用八爪鱼收集器爬取携程网上对于江西省内的民宿评价,并运用Jieba库进行高频词的筛选。研究发现:江西民宿空间分布呈集聚发展特征,并向风景名胜区集聚的特征。住客对江西省内的民宿总体比较满意,但有些地区的民宿仍需改进。 相似文献
2.
3.
4.
大数据时代,各行各业对数据采集的需求日益增多,其中使用JavaScript加密技术进行数据采集的需求广泛,但也存在不少瓶颈。文章采用JavaScript逆向爬虫技术还原参数加密过程,动态构造出某购物网站商品评价的统一资源定位系统(Uniform Resource Locator, URL),实现了指定分类下多商品评价数据的动态采集,为同类加密数据的采集提供了新的思路。使用SnowNLP[基于Python的中文自然语言处理(NLP)库]对采集到的乐高评论数据进行情感分析发现,约66%的购买者对商品给出了积极评论;情感分布呈极性,高段集中在0.8~1.0,低段集中在0.0~0.2;词云分析显示出购买者群体比较注重商品的快递包装外观。以上结论可为在线商家提升经营管理水平提供参考。 相似文献
5.
6.
使用Python爬虫从新浪微博获取数据,通过数据清洗、采用Jieba分词工具进行分词、去停用词等对数据进行预处理,构建了基于词典和文本分类算法的文本情感分析模型,对微博评论展开研究,模型准确率为0.878. 相似文献
7.
8.
通过利用大数据爬虫技术在电商网店中爬取某个商品的好评或差评大数据后,预处理爬取的评论使非结构化的数据去掉重复数据和无效数据,对处理后的数据进行分词、词性标注,去标点符号、去停用词处理,把非结构化数据转变为结构化数据,对评论数据采用算法构建模型并分析。采用基于决策树情感分析、情感词库分析、LDA模型的主题分析,综合3种方法对评论数据进行处理,得到一份最终的情感分析,从而得到消费者偏好的产品方向,以便商家能够获取进一步提升的方法。 相似文献
9.
10.
为了准确识别社交媒体评论文本情感,助力公众负面情绪引导,提出了基于CNN-LSTM的社交媒体大数据评论文本情感元自动识别方法。通过社交媒体大数据分类,并通过具有字典功能的Token将评论文本转换成数字列表。结合词嵌入技术得到向量列表,完成社交媒体大数据向量转换的预处理。将预处理获取的向量列表输入CNN网络,得到评论文本情感元最终局部特征值。将该值传至LSTM,通过遗忘门、输入门、输出门调节,获取评论文本情感元特征表征结果,经Softmax分类器分类后,实现情感元自动识别。实验结果表明,该方法能有效完成实验数据预处理,用文字和标签的形式标记正面、负面情感元,并准确识别情感元,间接反映社会问题,应用性较强。 相似文献
11.
针对评论文本情感分析研究中数据标注费时费力的问题,提出了一种新的数据自动标注方法。首先,通过基于情感词典的方法计算出评论文本的情感倾向;其次,利用用户评分的弱标注信息和基于词典方法的情感倾向对评论文本自动标注;最后,利用支持向量机(SVM)对评论文本进行情感分类。所提出的数据自动标注方法在两种类型数据集情感分类准确率上分别达到了77.2%和77.8%,相对于单一的利用用户评分对数据标注的方法,分别提高了1.7个百分点和2.1个百分点。实验结果表明,提出的数据自动标注方法在电影评论情感分析中能提高分类效果。 相似文献
12.
随着大数据时代下的数据来源和获取日趋重要,基于Python 的爬虫技术已成为获取数据工具的研究热点之
一。本文应用Python 爬虫关键技术对网易云季度歌词以及歌词相关文章的信息采集和汇总,并对其汇总后的网易歌词利用
Python 类库和数据分析技术对歌手情绪、词频统计、词云可视化以及歌手对时光和城市偏爱程度等进行数据分析。研究结果
表明,当下民谣歌手情绪稳定且有激情,能通过歌曲表达其正面情感,以及对当下时光与繁华城市的喜好。 相似文献
13.
为了有效识别商品虚假评论,提出一种基于情感极性与SMOTE过采样的虚假评论识别方法。首先,根据在线虚假评论的特点,构建一个多维虚假评论特征模型。其次,在情感极性算法中增加了情感极性均值和情感极性标准差等统计指标来全面刻画虚假评论。最后,针对虚假评论中的类不平衡问题,使用SMOTE算法优化随机森林分类模型,从而提高虚假评论识别效果。基于大众点评网的真实评论数据进行了多组实验,实验结果表明该方法在正负样本不平衡的虚假评论数据集中具有更高的准确率、召回率及F值。综合考虑情感极性和正负样本不平衡等因素可帮助电商平台有效过滤虚假评论,为消费者提供更加真实可靠的评论数据。 相似文献
14.
15.
本文提出了一种基于语义词典的网络评论文本情感分类及极性值计算方法,用于自动识别网络评论中的情感倾向。首先利用爬虫技术采集真实的电子商务网站在线评论文本数据,然后对语料做预处理,接着完成各类语义词典的构建和基础情感词典的扩充,最后使用本文提出的基于词典的无监督分类方法对获取的评论文本进行情感分类及极性值计算。实验结果表明,本文提出的情感识别方法对网络舆论的分类效果较为理想。 相似文献
16.
首先,采用爬虫技术爬取旅游网站中景点的游客评论数据,并清洗数据,进行数据去重、数据去噪以及去停用词等操作,将文本数据转换成词向量。其次,利用文本卷积神经网络(Text Convolutional Neural Networks,TextCNN)训练一个情感分类模型,并运用该模型对评论数据进行情感分析。最后,采用FlaskWeb技术开发一个旅游评论的情感分析和可视化系统。 相似文献
17.
分析了大数据公共课教学存在的理论抽象空泛,缺乏实践操作以及教学方式上的问题,从大数据课程教学内容、教学案例以及教学方式等方面提出了改革内容以及相应的改革措施.改革探索实践证明,利用Python进行大数据教学,使得学生通过案例掌握大数据课程的基础知识,了解Python在大数据上的应用,整体提升了课程的教学效果. 相似文献
18.
仵子俊 《中国信息技术教育》2022,(19):59-62
本文以项目学习为载体,对学科的核心素养围绕大单元教学设计内容进行细化、解构,在项目学习中对学科核心素养的支撑点重新进行整合与梳理,建构知识体系,并以“Python处理体能测试表格”项目为例,探究如何利用项目在高中信息技术课堂中落实大单元教学。 相似文献
19.
20.
从高职院校市场调研入手,利用Python爬虫工具获取招聘网上相关岗位信息,并对获得的信息利用Python数据工具进行筛选和分析,为高职院校的专业建设、课程调整提供了一些有价值的建议. 相似文献