首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
从宏观角度研究基于关键词的网络舆情热度有助于相关机构把握目标群体的整体舆情动态,从而实现精准施策,提升舆论引导水平.本文以新浪微博数据为例,采用因子分析方法(Factor Analysis,FA),挖掘舆情热度内在影响因素,并通过改进Elman网络结构,利用遗传算法(Genetic Algorithm,GA)优化初始参...  相似文献   

2.
随着互联网的快速发展,网络舆情成为政府部门和企业以及社会大众关注的焦点,对网络奥情进行有效监管和正确引导是当前巫待解决的问题,话题热度预测是典情监管和引导的基础。针对现有算法无法对新话题的热度进行有效预测的缺点,提出了一种基于K近部的新话题热度预测算法。该算法利用与新话题相似的历史话题的点击数时间序列来对新话题的热度进行预测。实验结果表明,在允许相对误差分别低于1000,20%和30%的情况下,算法预测的前3天点击数的平均正确率分别为47.2600,61%和67. 7"0,点击数变化趋势平均正确率达到73. 73 0 o,这也说明了相似的话题在话题出现的初期具有近似的热度变化趋势。  相似文献   

3.
传统的K-Means聚类算法只能保证收敛到局部最优,从而导致聚类结果对初始代表点的选择非常敏感;凝聚层次聚类虽无需选择初始的聚类中心,但计算复杂度较高,而且凝聚过程不可逆。结合网络舆情的特点,深入剖析了K-Means聚类算法和凝聚层次聚类算法的优缺点,对K-Means聚类算法进行改进。改进后算法的核心思想是,结合两种算法分别在初始点选择和聚类过程两个方面的优势,进行整合优化。通过实验分析及实际应用表明,改进后的文本聚类算法在很大程度上可以提高网络舆情信息聚类结果的准确性、有效性以及算法的效率。  相似文献   

4.
针对在线视频热度预测研究中分类及预测效果欠佳,规则化较多和较缺乏实践检验等问题,通过对实际在线视频服务系统所采集的海量数据研究,提出一种基于深度信念网络(Deep Belief Networks,DBNs)的视频热度预测方法。首先,结合社交网络的关注度和视频关键词的搜索热度,对影响因子进行了建模和量化处理;其次,根据输入和输出变量确定了DBNs各层网络的结构,优化了网络参数和预测模型;最后,通过在线视频服务商的数据对深度信念网络进行训练,并多次交叉实验对比分析,结果表明基于DBNs方法在视频热度预测上准确率最高79.47%(国内视频)、65.33%(国外视频),可以为在线视频上映前的投资、宣传以及风险评估提供较全面可靠的参考决策。  相似文献   

5.
随着无线传感器、卫星、GPS(global positioning system)等移动目标定位技术的发展,产生的移动数据(诸如人类足迹、车辆行驶轨迹和船舶轨迹等)的规模越来越大.而移动目标检测设备只会存储一系列离散点的信息,所以基于离散点来追踪和恢复其完整的轨迹是更加全面掌握移动目标运动规律的必要前提.数据挖掘方法能从移动目标的历史位置信息中挖掘出“规律”路径,其中基于网格的聚类分析方法不仅能有效表达这些轨迹点,还能分析出这些轨迹点之间的关系,是提取规律路径的有效方法.为此,提出了基于网格“热度值”的距离和密度相结合的热度因子相似性度量方法,进而给出了移动目标规律路径提取算法.最后,使用船舶自动识别系统(automatic identification system, AIS)生成的船舶实际动态数据进行测试,来验证该算法的精度和性能.算法分析和实验结果表明:基于网格热度值的规律路径提取算法能有效地发现不同形状的轨迹序列.  相似文献   

6.
网络是目前最重要的信息传播渠道,其自由性和丰富性使得信息迅速传播。挖掘网络中的热点主题对政府政策的制定、企业经营决策的调整可以提供强有力的支持,并能够满足网民对热点主题的关注需求。主题数量的庞大使得主题热度值的计算尤为重要,该文分析热度的形成原因,基于因果模型并采用面板数据,给出一种较为客观可行的主题热度计算模型。该模型使用易于获取的数据进行计算,给出较为客观的热度度量,进而便于不同主题、不同日期间的热度对比。在此基础上,通过对热度变化规律的考察,提出一种基于多峰高斯曲线拟合热度变化进行主题热度预测的思路。  相似文献   

7.
基于离群点剔除的网络热点事件挖掘算法   总被引:1,自引:0,他引:1  
研究网络热点事件准确检测问题,收集网络文本数据中含有大量的离群点,由于离群点一些噪声数据,对网络热点事件检测产生不利影响.为提高检测正确率,提出一种采用离群点剔除的网络热点事件挖掘算法.首先通过计算数据点的密度相似度,将小于阈值的离群点剔除,降低计算复杂度和离群点的不利影响,然后采用模糊C均值聚类算法对网络文本进行聚类,发现其中的热点事件,最后通过仿真测试算法的有效性.仿真结果表明,改进算法剔除网络中的离群点,不仅提高了网络热点事件检测正确率,而且降低算法计算复杂度,加快了网络热点事件挖掘速度,更加适合于网络热点事件在线挖掘要求.  相似文献   

8.
舆情监控系统解决的关键问题是如何有效且精确地对文本进行聚类,以便从大量Web网页中发现网络舆情热点话题。single-pass算法是话题发现中最常用的文本聚类算法,但其在文本聚类的精度和时效方面存在不足,因而论文在对大量新闻报道语料进行深入分析的基础上,从三个方面对single-pass进行了改进。通过实验求证,发现改进后的sin-gle-pass算法在漏检率、误检率和耗费函数等方面有了明显改善。  相似文献   

9.
改进的K-means 算法在网络舆情分析中的应用   总被引:1,自引:0,他引:1  
结合网络舆情分析的应用需求背景,首先介绍了文本信息的处理,然后探讨了文本聚类中的K-means算法,针对其对初始聚类中心的依赖性的特点,对算法加以改进。基于文档标题能够代表文档内容的思想,改进算法采用稀疏特征向量表示文本标题,计算标题间的稀疏相似度,确定初始聚类中心。最后实验证明改进的K-means算法提高了聚类的准确度;与基于最大最小距离原则的初始中心选择算法比较,提高了执行效率,同时保证了聚类准确度。  相似文献   

10.
社交网络现已成为现实世界中信息传播与扩散的主要媒介,对其中的热点信息进行建模和预测有着广泛的应用场景和商业价值,比如进行信息传播挖掘、广告推荐和用户行为分析等.目前的相关研究主要利用特征和时间序列进行建模,但是并没有考虑到社交网络中用户的社交圈层对于信息传播的作用.本文提出了一种基于社交圈层和注意力机制的热度预测模型S...  相似文献   

11.
传统的Peeer-to-Peer(P2P)网络的研究已经基本上解决了分布式网络路由问题,为提高路由的效率,如何有效地缩短路由距离成为当前急需解决的热点.针对这一问题,在分析现有的路由算法的基础上,提出一种基于位置信息的P2P路由算法.算法中结合传统算法和节点所在区域位置的信息,使得网络节点在决定下一步跳转时,优先选择距离较近的节点,从而提高路由效率,减少路由延时.  相似文献   

12.
现有的Ad Hoc网络分群算法大多对网络的稳定性考虑不足,在实际场景中难以应用。从已有分群技术出发,对三种分群算法进行比较分析,在模糊聚类的基础上,设计了Packet数据包和定时器,并利用隶属度的概念,提出了一种新型CABF(Clustering Algorithm Based FCM)分群算法。仿真结果表明,该算法与最小ID算法、WCA算法、LEACH算法相比,具有更好的稳定性。  相似文献   

13.
一种基于代数算法的RBF神经网络优化方法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种新的RBF神经网络的训练方法,采用动态K-均值方法对RBF 神经网络的隐层中心值和宽度进行了优化,用代数算法训练隐层和输出层之间的权值。在对非线性函数进行逼近的仿真中,验证了该算法的有效性。  相似文献   

14.
基于云遗传的RBF神经网络的交通流量预测   总被引:1,自引:0,他引:1  
以神经网络和混沌时间序列理论为基础,提出了一种基于云遗传的RBF神经网络优化算法。该算法利用云模型云滴的随机性和稳定倾向性的特点,由正态云模型的Y条件云发生器实现交叉操作,由基本云发生器实现变异操作,提高了遗传搜索的效率,精简了网络结构。将该算法应用到Logistic混沌时间序列和实测交通流时间序列进行算法的有效性验证,并与传统的RBF算法和遗传算法优化的RBF算法(GARBF)进行比较。仿真结果表明该算法对混沌时间序列和交通流预测的精度有较大提高,从而证明该算法在交通流时间序列预测领域的可行性和有效性。  相似文献   

15.
柳赛男  陈明亮 《控制与决策》2014,29(9):1724-1728

对网络舆情监测监控云平台上集聚的海量技术agent, 如果只是逐一agent 搜寻使联盟的利益最大化, 将耗费大量的时间和费用. 为解决该问题, 提出了基于“能力群”的动态联盟机制, 通过动态增加或删除“能力群”中的agent 来增加联盟完成复杂任务的能力; 并提出一种基于文化算法的“能力群”agent 联盟算法, 详细讨论了算法的流程、编码、选择、交叉和变异操作的规则, 以及基于“能力群”特征的交叉算法. 仿真结果表明, 所提出的算法是可行和有效的.

  相似文献   

16.
提出了一种基于四叉树K-均值聚类算法的软件故障预测算法.采用四叉树的目的包括利用四叉树寻找K-均值聚类算法所需要的聚类中心和利用四叉树来进行软件模块的故障预测.在这种算法中,输入门限参数决定了最初的聚类中心,通过改变门限参数,用户可以得到期望的聚类中心.采用了聚类收益这个新的标准来衡量算法的性能.通过仿真和比较,算法具有最高的聚类收益,且在大多数情况下,总体错误率比其他算法更低,从而表明了算法在软件故障预测中的有效性.  相似文献   

17.
遗传算法优化BP神经网络的混沌时间序列预测   总被引:4,自引:0,他引:4       下载免费PDF全文
为提高BP神经网络预测模型对混沌时间序列的预测精度,将改进的遗传算法和BP神经网络结合,提出了一种基于改进遗传算法优化BP神经网络的混沌时间序列预测方法。利用改进的遗传算法优化BP神经网络的权值和阈值,训练BP神经网络预测模型求得最优解。将该模型应用到几个典型的非线性系统进行预测仿真,验证了该算法的有效性,与BP神经网络预测模型的预测结果进行了比较,仿真结果表明该方法对混沌时间序列具有更好的非线性拟合能力和更高的预测精度。  相似文献   

18.
自行车共享系统逐渐出现在许多城市中,由于在不同时间和站点的自行车需求量(租/还量)的不平衡,系统中各站点的自行车需要人工频繁地使其不断达到平衡状态,然而实时监控并不能很好的解决这个问题。因此,提出了一个基于网络图的预测模型,可以预测未来时间段内的某个站点自行车的需求量,提前对自行车的重新分配。首先,我们通过分层聚类算法对预测站点进行聚类,得到与其相关的站点簇。其次,对站点簇构建网络模型。最后,使用纽约和华盛顿两个自行车共享系统的数据进行实验和结果分析。结果发现同一簇的站点具有相似的使用模式,模型预测误差率不高于0.45,且能够应用于不同城市的自行车共享系统。  相似文献   

19.
为了提高K-medoids算法的精度和稳定性,并解决K-medoids算法的聚类数目需要人工给定和对初始聚类中心点敏感的问题,提出了基于密度权重Canopy的改进K-medoids算法。该算法首先计算数据集中每个样本点的密度值,选择密度值最大的样本点作为第1个聚类中心,并从数据集中删除这个密度簇;然后通过计算剩下样本点的权重,选择出其他聚类中心;最后将密度权重Canopy作为K-medoids的预处理过程,其结果作为K-medoids算法的聚类数目和初始聚类中心。UCI真实数据集和人工模拟数据集上的仿真实验表明,该算法具有较高的精度和较好的稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号