首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
体验经济时代的到来,民宿的出现满足了游客的个性化需求,促使住客发表民宿体验情况以表达情感。通过运用poikit获得江西省内民宿的信息,并把信息传入Arcgis和江西省矢量地图叠加,并进行分析。运用八爪鱼收集器爬取携程网上对于江西省内的民宿评价,并运用Jieba库进行高频词的筛选。研究发现:江西民宿空间分布呈集聚发展特征,并向风景名胜区集聚的特征。住客对江西省内的民宿总体比较满意,但有些地区的民宿仍需改进。  相似文献   

2.
由于当代信息化、网络化技术以及大数据的发展和普及,人民群众越来越多地利用互联网、平台选择旅游和住宿。旅游大数据可以为人们提供更加优质的平台和更加丰富的选择。在互联网旅游平台崛起的背景下,我国民宿行业呈现迅速发展的趋势,并成为一个新的经济增长点。但是,由于我国民宿行业起步较晚,目前仍存在一些问题和不足。笔者意在通过分析我国民宿的现状,为旅游大数据下民宿的信息化发展提供可行性建议。  相似文献   

3.
海量的观影评论包含着广大观众对影视作品各方面的偏好,可以为影视剧的拍摄和宣传提供决策支持。提出影视剧在线评论分析模型:利用Python爬取传媒平台的评论信息,经过数据预处理和分词,分别采用SVM方法和LSTM方法对短评文本和长评文本进行情感极性分析,运用统计和可视化方法研究评论词语、语义网络关系、情感倾向演化、文本内容特征和地域热度分布。以公安剧《狂飙》为例进行实证分析,结果表明所提模型可以合理揭示总体情感热度演变规律,发现观众发表评论的内容偏好、行为规律和地域特征。  相似文献   

4.
邢羽琪  杨柽 《软件工程》2023,(12):41-45
大数据时代,各行各业对数据采集的需求日益增多,其中使用JavaScript加密技术进行数据采集的需求广泛,但也存在不少瓶颈。文章采用JavaScript逆向爬虫技术还原参数加密过程,动态构造出某购物网站商品评价的统一资源定位系统(Uniform Resource Locator, URL),实现了指定分类下多商品评价数据的动态采集,为同类加密数据的采集提供了新的思路。使用SnowNLP[基于Python的中文自然语言处理(NLP)库]对采集到的乐高评论数据进行情感分析发现,约66%的购买者对商品给出了积极评论;情感分布呈极性,高段集中在0.8~1.0,低段集中在0.0~0.2;词云分析显示出购买者群体比较注重商品的快递包装外观。以上结论可为在线商家提升经营管理水平提供参考。  相似文献   

5.
在数据科学飞速发展的今天,传统数据分析已经不能满足大数据时代的需求。为了能够对数据进行更有效的分析,利用拥有强大绘图功能的Python语言处理数据可视化是十分必要的。本文利用Python包含的基本库进行实例数据可视化,对数据以柱状图、折线图、词云等形式插入呈现。同时对Python在数据可视化中的优势进行分析,展示利用Python进行数据可视化的优势。研究结果表明,利用Python将数据用图表及其他更直观的方式等能够帮助人们快速处理和理解数据。  相似文献   

6.
使用Python爬虫从新浪微博获取数据,通过数据清洗、采用Jieba分词工具进行分词、去停用词等对数据进行预处理,构建了基于词典和文本分类算法的文本情感分析模型,对微博评论展开研究,模型准确率为0.878.  相似文献   

7.
《程序员》2009,(2):120-121
Google博客数据转换器发布近日Google Data Liberation团队正式发布Google Blog Converters 1.0。该开源工具可以在不同博客服务之间自由转移文章和评论数据。第一个版本提供了Python程序库及相关可执行脚本,用于相互转换Blogger、LiveJournal、MovableType和WordPress导出的各种数据  相似文献   

8.
通过利用大数据爬虫技术在电商网店中爬取某个商品的好评或差评大数据后,预处理爬取的评论使非结构化的数据去掉重复数据和无效数据,对处理后的数据进行分词、词性标注,去标点符号、去停用词处理,把非结构化数据转变为结构化数据,对评论数据采用算法构建模型并分析。采用基于决策树情感分析、情感词库分析、LDA模型的主题分析,综合3种方法对评论数据进行处理,得到一份最终的情感分析,从而得到消费者偏好的产品方向,以便商家能够获取进一步提升的方法。  相似文献   

9.
《软件工程师》2016,(2):43-46
在大数据获取中面临着如何采集动态评论网页的问题,这篇论文使用静态网页信息构造动态链接,提出了基于Python的动态网页评论爬虫算法。在此基础上实现了评论收集程序。最后将它与通用爬虫算法进行比较,证实了该算法具有针对性强、数据采集速度快、易嵌入开发、简单等优点,为不善于编程的新闻、文学、管理等学科的研究者提供了快速获取评论信息的方法。  相似文献   

10.
刘丹 《微型电脑应用》2024,(4):195-197+201
为了准确识别社交媒体评论文本情感,助力公众负面情绪引导,提出了基于CNN-LSTM的社交媒体大数据评论文本情感元自动识别方法。通过社交媒体大数据分类,并通过具有字典功能的Token将评论文本转换成数字列表。结合词嵌入技术得到向量列表,完成社交媒体大数据向量转换的预处理。将预处理获取的向量列表输入CNN网络,得到评论文本情感元最终局部特征值。将该值传至LSTM,通过遗忘门、输入门、输出门调节,获取评论文本情感元特征表征结果,经Softmax分类器分类后,实现情感元自动识别。实验结果表明,该方法能有效完成实验数据预处理,用文字和标签的形式标记正面、负面情感元,并准确识别情感元,间接反映社会问题,应用性较强。  相似文献   

11.
樊振  过弋  张振豪  韩美琪 《计算机应用》2018,38(11):3084-3088
针对评论文本情感分析研究中数据标注费时费力的问题,提出了一种新的数据自动标注方法。首先,通过基于情感词典的方法计算出评论文本的情感倾向;其次,利用用户评分的弱标注信息和基于词典方法的情感倾向对评论文本自动标注;最后,利用支持向量机(SVM)对评论文本进行情感分类。所提出的数据自动标注方法在两种类型数据集情感分类准确率上分别达到了77.2%和77.8%,相对于单一的利用用户评分对数据标注的方法,分别提高了1.7个百分点和2.1个百分点。实验结果表明,提出的数据自动标注方法在电影评论情感分析中能提高分类效果。  相似文献   

12.
随着大数据时代下的数据来源和获取日趋重要,基于Python 的爬虫技术已成为获取数据工具的研究热点之 一。本文应用Python 爬虫关键技术对网易云季度歌词以及歌词相关文章的信息采集和汇总,并对其汇总后的网易歌词利用 Python 类库和数据分析技术对歌手情绪、词频统计、词云可视化以及歌手对时光和城市偏爱程度等进行数据分析。研究结果 表明,当下民谣歌手情绪稳定且有激情,能通过歌曲表达其正面情感,以及对当下时光与繁华城市的喜好。  相似文献   

13.
为了有效识别商品虚假评论,提出一种基于情感极性与SMOTE过采样的虚假评论识别方法。首先,根据在线虚假评论的特点,构建一个多维虚假评论特征模型。其次,在情感极性算法中增加了情感极性均值和情感极性标准差等统计指标来全面刻画虚假评论。最后,针对虚假评论中的类不平衡问题,使用SMOTE算法优化随机森林分类模型,从而提高虚假评论识别效果。基于大众点评网的真实评论数据进行了多组实验,实验结果表明该方法在正负样本不平衡的虚假评论数据集中具有更高的准确率、召回率及F值。综合考虑情感极性和正负样本不平衡等因素可帮助电商平台有效过滤虚假评论,为消费者提供更加真实可靠的评论数据。  相似文献   

14.
《微型机与应用》2021,(1):45-49
随着大数据时代的来临,网络舆情对消费者情感分析和商家营销策略产生重大影响。如何利用大数据技术提高车企舆情情感分析效能,受到文本挖掘研究者广泛关注。针对传统RNN在长文本分类中的长期依赖问题,提出了一种注意力机制与Bi-LSTM结合的混合分类算法(At-Bi-LSTM)。算法利用BiLSTM分析车企网络评论的情感,引入注意力机制计算不同单词对评论情感的贡献权重,降低长文本中无关词对分类结果的影响。实验证明,At-Bi-LSTM算法在车企舆情情感分类上取得了比朴素贝叶斯、SVM、LSTM更好的分类效果。  相似文献   

15.
本文提出了一种基于语义词典的网络评论文本情感分类及极性值计算方法,用于自动识别网络评论中的情感倾向。首先利用爬虫技术采集真实的电子商务网站在线评论文本数据,然后对语料做预处理,接着完成各类语义词典的构建和基础情感词典的扩充,最后使用本文提出的基于词典的无监督分类方法对获取的评论文本进行情感分类及极性值计算。实验结果表明,本文提出的情感识别方法对网络舆论的分类效果较为理想。  相似文献   

16.
杜春 《信息与电脑》2022,(24):154-157
首先,采用爬虫技术爬取旅游网站中景点的游客评论数据,并清洗数据,进行数据去重、数据去噪以及去停用词等操作,将文本数据转换成词向量。其次,利用文本卷积神经网络(Text Convolutional Neural Networks,TextCNN)训练一个情感分类模型,并运用该模型对评论数据进行情感分析。最后,采用FlaskWeb技术开发一个旅游评论的情感分析和可视化系统。  相似文献   

17.
分析了大数据公共课教学存在的理论抽象空泛,缺乏实践操作以及教学方式上的问题,从大数据课程教学内容、教学案例以及教学方式等方面提出了改革内容以及相应的改革措施.改革探索实践证明,利用Python进行大数据教学,使得学生通过案例掌握大数据课程的基础知识,了解Python在大数据上的应用,整体提升了课程的教学效果.  相似文献   

18.
本文以项目学习为载体,对学科的核心素养围绕大单元教学设计内容进行细化、解构,在项目学习中对学科核心素养的支撑点重新进行整合与梳理,建构知识体系,并以“Python处理体能测试表格”项目为例,探究如何利用项目在高中信息技术课堂中落实大单元教学。  相似文献   

19.
视频网站的用户评论、弹幕逐渐成为视频内容之外的一个引起热议的话题。视频评论作为新的文化产品和文化形式,引起了社会的关注。文章以B站为例,通过网络爬虫收集数据,利用大数据相关技术,对评论数据进行处理分析,并以词云图及散点图的方式呈现用户的关注点及语言表达的差异性,直观地为相关研究提供参考。  相似文献   

20.
从高职院校市场调研入手,利用Python爬虫工具获取招聘网上相关岗位信息,并对获得的信息利用Python数据工具进行筛选和分析,为高职院校的专业建设、课程调整提供了一些有价值的建议.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号