共查询到19条相似文献,搜索用时 78 毫秒
1.
微博文本数据高维度、同义、多义特征明显,传统基于向量空间模型(VSM)联合K-均值的热点话题发现方法存在准确率低,计算复杂,聚类中心难以确定等问题。提出一种相关向量机(RVM)优化VSM的微博文本向量化方法,首先利用RVM的自适应特征选择能力对VSM特征向量进行降维,然后利用主成分分析(PCA)方法确定K-均值算法的初始聚类中心,进而采用K-均值算法得到聚类结果,最后根据微博转发、评论和高影响力用户数量定义热度指数,热度指数最大的话题即为当前热点话题。采用实际微博文本数据集开展实验,结果表明所提方法相对于2种传统方法的准确率分别提升7.3%和1.1%,实时性分别提升45%和53%。 相似文献
2.
快速准确的在海量网络数据中发现热点主题对于网络舆情监控具有重要作用.针对K-means算法对初始中心点选择敏感和全局搜索能力不足的问题,提出一种基于Hadoop的改进灰狼优化K-means的IGWO-KM算法.首先,该算法将灰狼优化算法和K-means算法相结合,利用灰狼优化算法收敛速度快和可全局寻优的优势为K-means搜索最佳聚类中心,减小随机选取初始中心点而导致的聚类结果不稳定性,以获取更好的聚类结果.其次,使用非线性收敛因子改进灰狼优化算法,协调算法的全局和局部的搜索能力.然后,引入正弦余弦算法并进行改进,增强灰狼优化算法的全局搜索能力,优化寻优精度和收敛速度,避免陷入局部最优.之后,使用近邻空间球减少K-means聚类过程中冗余的距离计算加快算法收敛.最后,利用Hadoop集群可批量处理数据的特性,实现算法的并行化.实验结果表明,IGWO-KM算法具有更好的寻优精度和稳定性,相比于GWO-KM算法和K-means,该算法在查准率、召回率和F值均有明显提高,且具有良好的收敛速度和拓展性. 相似文献
3.
4.
一种改进的基于SNMP的网络拓扑发现算法 总被引:5,自引:1,他引:5
研究并提出了一种基于SNMP的拓扑自动发现的改进算法。与一般拓扑发现算法相比.改进算法可发现指定深度网络内所有路由设备及指定子网内所有活动主机,解决了包含三层交换机的网络中拓扑发现不完整的问题,并对改进算法中网络设备相关MIB对象解析以及指定子网中活动主机发现等关键技术进行了分析。 相似文献
5.
6.
针对微博数据文本内容短小、特征词稀疏以及规模庞大的特点,提出了一种基于MapReduce编程模型的发现微博热点话题的方法。该方法首先利用隐主题分析技术解决了微博内容短小、特征词稀疏的问题,然后利用CURE算法缓解了Kmeans算法对初始点敏感的问题,最后采用基于MapReduce编程模型Kmeans聚类算法,对海量微博短文本数据进行快速聚类。实验结果表明该方法可以有效提高微博热点话题发现的效率。 相似文献
7.
K-means算法因其简单、易理解、速度快等优点在众多领域得到广泛的应用,然而该算法的K值选取,初始聚类点的选取和对于孤立点的处理等都会影响最终聚类结果.根据k-means算法目前的应用研究现状,针对这些缺点对算法进行改进,最后指出了改进中存在的一些问题,并指出未来的研究方向. 相似文献
8.
林龙成 《电子技术与软件工程》2020,(1):111-112
本文对K-means算法的缺点做出了一些改进,提出了一种基于遗传算法GA-K-means的算法。利用遗传算法初始化K-means的初始聚类中心点,改进后的算法解决了K-means算法容易因为初始聚类中心的选择不同而陷入局部最优解的问题。实验表明,改进后的算法聚类结果稳定且聚类效果较好。 相似文献
9.
《电子技术与软件工程》2020,(1)
本文对K-means算法的缺点做出了一些改进,提出了一种基于遗传算法GA-K-means的算法。利用遗传算法初始化K-means的初始聚类中心点,改进后的算法解决了K-means算法容易因为初始聚类中心的选择不同而陷入局部最优解的问题。实验表明,改进后的算法聚类结果稳定且聚类效果较好。 相似文献
10.
11.
基于时空分布特征的新闻字幕检测改进算法 总被引:2,自引:0,他引:2
在分析视频字幕时空分布特征的基础上,采用帧间差分方法提取字幕候选区域,再采用双峰阈值法对字幕区域二值化处理,最后采用积分投影法对字幕区域作行列分割,提取出用于OCR识别系统的单个文字图像.实验表明算法有较高的准确率,能满足视频检索中获取语义信息的需求. 相似文献
12.
随着网络结构的不断扩大和日益复杂,传统的重叠社区发现算法已经不能有效地处理大规模网络数据,发现合理的社区结构.本文提出了顶点引力的概念,引入顶点凝聚度和社区凝聚度作为满足社区的外部结构稀疏性和社区内部结构紧密性的判定指标,构造了基于结构紧密性的重叠社区发现算法OCSC.该算法经过预处理,核心子图划分以及核心社区的扩展三个步骤,能有效地发现重叠社区,通过对人工合成网络和真实网络结构的社区发现实验,运用NMI和F1Score等指标验证OCSC算法的合理性和优越性. 相似文献
13.
宰家斌 《微电子学与计算机》2008,25(2):100-103
分析了基于ICMP协议的 Traceroute传统发现方法的低效,详细描述了双向树拓扑发现方法.结合启发式发现方法,提出了一种改进的拓扑发现方法.实验数据表明,该方法能够快速、准确地获得网络拓扑结构,更有效的降低网络负载. 相似文献
14.
针对关联规则中Apriori算法的不足之处,提出两种基于矩阵的Apriori改进算法.改进算法充分利用矩阵这一工具,以大幅度减少扫描数据库的次数和计算成本,进而有效提高算法的运算效率.同时,通过实例应用和算法性能分析证明所提出的两种改进算法都是有效的关联规则挖掘方法,且比Apriori算法具有更好的性能. 相似文献
15.
基于改进遗传算法的TSP问题研究 总被引:9,自引:1,他引:9
周涛 《微电子学与计算机》2006,23(10):104-106,110
通过对遗传算法和TSP问题的研究.提出了离散赌轮选择算子EPMX交叉算子和Dmutation变异算子等,对遗传算法的各个算子进行了改进。利用改进的遗传算法有效的解决了TSP问题.实验验证其与传统的解决方式相比有更好的收敛特性,解的准确性更好。 相似文献
16.
The iterative decoding in turbo code has very high decoding complexity. This paper adopts the improved Log-MAP algorithm for
decoding of Space-Time Turbo Trellis Code (ST-Turbo TC) in the slow Rayleigh fading channels. Using the MacLaurin formulae,
the proposed algorithm expands the logarithmic function of the Log-MAP. It makes the computation much easier and the operation
of the hardware system much faster. Simulation results show that the proposed algorithm performs very closely to the Log-MAP
algorithm for decoding of ST-Turbo TC in slow Rayleigh fading channels. 相似文献
17.
18.
基于压缩矩阵方式的Apriori改进算法 总被引:1,自引:0,他引:1
针对关联规则中Apriori算法的不足之处,提出两种基于压缩矩阵方式的Apriori改进算法,改进算法充分利用矩阵并对其进行压缩,以大幅度减少扫描数据库的次数,并提高频繁项集的生成效率,从而有效提升算法的运算效率,同时,.,通过实例应用和算法性能兮析证明所提出的两种改进算法部是有效的关联规则挖掘方法。且比Apri算法具有最好的性能. 相似文献
19.
DNA序列中的模体发现是生物信息学中重要的问题。目前解决这一问题的算法,如Gibbs采样算法,都假设模体内部各个位置之间相互独立。但最近的生物实验证实,有些模体内部各个位置之间存在明显的依赖性。文中将内部依赖性引入得分函数,同时改进了Gibbs采样算法的收敛条件和相移方法,提出PIGS算法。实验结果表明,查找出的模体在准确度方面有较大提高。 相似文献