首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
个性推荐技术,可针对海量的数据实现快速准确的推荐。目前,协同过滤算法作为主流推荐技术,却存在着冷启动、数据稀疏和可扩展性等问题。虽然联合聚类协同过滤算法在解决可扩展性与数据稀疏方面有一定的效果,实时性高,但很难获得全局最优结果。因此,文中提出支持用户属性特征联合聚类的协同过滤算法以联合聚类为基础,融合了基于内容的推荐算法的优点,并经进一步改进以完成高准确率的推荐。实验结果表明,该算法实时响应快,一定程度上克服了冷启动和数据稀疏问题,且推荐质量较高。  相似文献   

2.
《现代电子技术》2020,(1):102-106
针对传统网格聚类算法聚类精度较低,处理流数据效率较低等问题进行改进。提出局部网格动态聚类算法,算法引入维度半径概念进行增量动态网格划分,通过采用新的簇边界判定方法对簇边界进行判定,依据稀疏网格与其邻接密集网格的质心距离,将稀疏网格归并到相应网格簇中,对于不能归并的稀疏网格则采用局部网格划分方法对稀疏网格再次进行划分聚类,避免簇边界的误删,在一定程度上提高了聚类精确度。通过对比实验结果表明提出的算法具有更好的聚类时效性和聚类精度。  相似文献   

3.
针对微博数据文本内容短小、特征词稀疏以及规模庞大的特点,提出了一种基于MapReduce编程模型的发现微博热点话题的方法。该方法首先利用隐主题分析技术解决了微博内容短小、特征词稀疏的问题,然后利用CURE算法缓解了Kmeans算法对初始点敏感的问题,最后采用基于MapReduce编程模型Kmeans聚类算法,对海量微博短文本数据进行快速聚类。实验结果表明该方法可以有效提高微博热点话题发现的效率。  相似文献   

4.
《现代电子技术》2016,(1):148-152
考虑到传统Web文档聚类算法聚类效果差、速度慢等问题,针对Web文档聚类算法进行深入研究,使用目标优化策略将Web文档聚类认为是最佳划归文档集合的范畴,并通过引入优化算法进行聚类划分。针对使用SVD表示的Web文档向量存在高维稀疏性等问题,使用LDA对Web文档簇的潜在语义子空间进行重构,从而降低Web文档向量空间的维数,最后在低维空间使用遗传算法进行寻优。常规的GA算法通常存在算法早熟以及局部寻优能力弱等问题。故提出一种改进型GA算法,通过引入自适应对偶种群、自适应终止规则以及新的生成子代规则来保证种群在迭代过程中的多样性以解决算法早熟问题,并且要提高算法的搜索效率以提高算法对局部寻优的能力。最后通过实验验证提出的基于改进型GA算法的Web文档聚类算法的聚类有效性。  相似文献   

5.
付宁  乔立岩  彭喜元 《电子学报》2009,37(Z1):92-96
 混合矩阵的估计是稀疏源盲分离的关键组成部分,其估计精度直接影响到源信号的估计精度.本文首先针对K-means聚类算法依赖初始值选取的问题,将微分进化算法思想引入到K-means聚类算法中,提出了一种改进的K-means聚类算法.利用该算法,对稀疏源混合信号数据进行聚类,保证了聚类结果的鲁棒性.然后利用霍夫变换,对每一类数据的聚类中心进行修正,从而估计出混合矩阵,提高了混合矩阵的估计精度.仿真实验表明,相比于经典的稀疏源混合矩阵盲估计算法,本文算法具有更强的鲁棒性和更高的估计精度.  相似文献   

6.
周永权  焦李成 《电子学报》2004,32(8):1342-1345
针对高属性维稀疏数据聚类问题,定义了模糊取大逻辑神经元,给出一种新的单层离散型回归逻辑神经网络模型,由稀疏特征差异度组成的相似阵作为该网络的初始权矩阵,通过单层离散型回归逻辑神经网络学习算法,可求出相似矩阵的等价阵,根据等价阵,给定不同的阈值,可动态地、有效地实现对高属性维稀疏数据的归并,使得聚类结果更符合实际情况,聚类质量较高.相比同类聚类算法,它具有学习、修正和应变功能,适用于大规模稀疏数据库和稀疏数据仓库的聚类分析.  相似文献   

7.
向志华  邵亚丽 《电子科技》2019,32(11):70-73
为解决传统聚类算法无法对高维数据聚类的问题,文中提出了一种结合贪心选择和特征加权的TC-Mean shift高维数据聚类算法。通过对一维数据进行聚类,获得一维数据的聚类结果,再通过加权添加维度聚类,最终获得所有维度数据的聚类,实现对高维数据的聚类。测试结果表明,该算法能够准确地对稀疏的高维数据样本进行聚类,能够处理各种维度的数据,具有良好的实际应用价值。  相似文献   

8.
针对传统网格聚类算法应用于雷达信号分选中存在密度阈值不够合理、聚类精度较低的问题,提出了一种基于改进网格聚类的动态雷达信号分选算法。该算法引入CluStream聚类算法中的双层框架,增加了分选系统的实时性。通过双密度阈值策略和边缘稀疏网格优化处理,改进了传统网格聚类算法,合理地设置了密度阈值。仿真结果表明,该方法具备较高的抗干扰能力和聚类精度,取得了较好的分选效果。  相似文献   

9.
于淼  杨武  王巍  申国伟 《通信学报》2016,37(1):151-159
针对大规模微博中多实体间的稀疏关系数据,提出一种面向多实体稀疏关系数据的高效联合聚类算法。在算法中,为了充分利用多关系数据,提出了一种顽健的约束信息嵌入方法构建关系矩阵,降低了矩阵的稀疏性,进一步提高了算法的准确率。在稀疏约束的块坐标下降框架下,关系矩阵通过非负矩阵三分解算法同时获得不同实体的聚类指示矩阵。非负矩阵分解过程中,通过高效的投射算法实现快速求解,确保了聚类结果的稀疏结构。在人工和真实数据集上的实验表明,算法在3个指标上都具有明显提高,特别是在极端稀疏数据上的效果更加明显。  相似文献   

10.
基于ICA的雷达信号欠定盲分离算法   总被引:2,自引:0,他引:2  
该文针对源信号时域和频域不充分稀疏的情况,提出了欠定盲源分离中估计混合矩阵的一种新方法。该方法对等间隔分段的观测信号应用独立分量分析(ICA)的盲分离算法获得多个子混合矩阵,然后对其分选剔除了不属于原混合矩阵的元素,最后利用C均值聚类的学习算法获得对混合矩阵的精确估计,解决了源信号在时域和频域不充分稀疏的情况下准确估计混合矩阵的问题。在估计出混合矩阵的基础上,利用基于稀疏分解的统计量算法分离出源信号。由仿真结果,以及与传统的K均值聚类,时域检索平均算法对比的实验结果说明了该文算法的有效性和鲁棒性。  相似文献   

11.
针对方位标测量数据手工预处理方式工作强度大、效率低和出错率高的问题,根据测量数据一般多数集中于真值附近的特性,提出了一种基于模糊聚类技术的方位标测量数据预处理方法,通过反复聚类自动挑选出符合要求的方位标数据.实验证明:此种方法挑选效率高,挑选的数据与真值吻合程度高,并具有较高的抑制野点作用.  相似文献   

12.
基于相似度的词聚类算法   总被引:1,自引:1,他引:0  
基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.传统的统计方法基于贪婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准.传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优.本文提出了词相似度定义、词集合相似度定义,一种自下而上的分层聚类算法.这种方法不但能改善聚类效果,而且可根据不同的模型选择不同的相似度定义,从而提高聚类的使用效果.  相似文献   

13.
《电子学报:英文版》2017,(6):1221-1226
Category-based statistic language model is an important method to solve the problem of sparse data in statistical language models. But there are two bottlenecks about this model: 1) The problem of word clustering, it is hard to find a suitable clustering method that has good performance and has not large amount of computation; 2) Class-based method always loses some prediction ability to adapt the text of different domain. In order to solve above problems, a novel definition of word similarity by utilizing mutual information was presented. Based on word similarity, the definition of word set similarity was given and a bottom-up hierarchical clustering algorithm was proposed. Experimental results show that the word clustering algorithm based on word similarity is better than conventional greedy clustering method in speed and performance, the perplexity is reduced from 283 to 207.8.  相似文献   

14.
薛俊韬  倪晨阳  杨斯雪 《红外与激光工程》2018,47(11):1126001-1126001(9)
针对图像修复过程中单一的字典迭代时间长、适应性差、修复效果不理想的缺点,提出了一种结合图像特征聚类与字典学习的改进的图像修复方式。首先破损的图像被分割成小块,并产生索引矩阵。然后使用控制核回归权值算法,对其进行图像聚类。通过对图像内在结构与未破损区域信息的挖掘,分割的图像块根据SKRW的相似性进行了分类。之后针对不同类型结构的图像,通过自适应局部明感字典学习的方式,获取每类字典的过完备字典。然后,通过构建自适应局部配适器,提高字典更新的收敛速度与稀疏字典的适应性。因为是通过多个字典匹配不同结构的图像,因此图像的稀疏表示更为准确。各个字典在达到收敛之前不断进行更新,而图像的稀疏因子也会随着改变。在对破损区域进行补丁更换之后,实现了对破损图像的修复。实验结果表明,该算法相较于目前的修复算法,视觉效果和客观评价上更好,且所需的修复时间更短。  相似文献   

15.
Underdetermined blind source separation (UBSS) is a hard problem to solve since its mixing system is not invertible. The well-known “two-step approach” has been widely used to solve the UBSS problem and the most pivotal step is to estimate the underdetermined mixing matrix. To improve the estimation performance, this paper proposes a new clustering method. Firstly, the observed signals in the time domain are transformed into sparse signals in the frequency domain; furthermore, the linearity clustering of sparse signals is translated into compact clustering by normalizing the observed data. And then, the underdetermined mixing matrix is estimated by clustering methods. The K-means algorithm is one of the classical methods to estimate the mixing matrix but it can only be applied to know the number of clusters in advance. This is not in accord with the actual situation of UBSS. In addition, the K-means is very sensitive to the initialization of clusters and it selects the initial cluster centers randomly. To overcome the fatal flaws, this paper employs affinity propagation (AP) clustering to get the exact number of exemplars and the initial clusters. Based on those results, the K-means with AP clustering as initialization is used to precisely estimate the underdetermined mixing matrix. Finally, the source signals are separated by linear programming. The experimental results show that the proposed method can effectively estimate the mixing matrix and is more suitable for the actual situation of UBSS.  相似文献   

16.
针对基于支持向量机的聚类算法中,由于高斯核在无限远处的衰减几乎为零,从而影响聚类效果的问题,采用了改进的高斯核函数。该方法使在高维特征空间中,核函数不仅满足在测试点附近有较快的衰减速度,而且在无限远处仍能保持适度的衰减,从而提高聚类效果。实验表明,改进的高斯核比高斯核聚类错误率更低。  相似文献   

17.
模糊核聚类算法是一种结合无监督聚类和模糊集合概念的图像分割技术,已广泛应用于图像分割领域,但其算法对初值敏感,很大程度上依赖初始聚类中心的选择,并且容易收敛于局部极小值,用于图像分割时,隶属度的计算只考虑了图像中当前的像素探值,而未考虑邻域像素探间的相互关系,故对分割含有噪声图像不理想。故提出了一种改进的模糊核聚类图像分割算法,先通过数据约简,不损失数据聚类结构的前提下对数据进行挖掘,然后在模糊核聚类算法中引入特性核函数,将约简后的数据映射到高维非线性特征空间进行划分,最后再利用表征邻域像素的参数来修正当前空间像素的隶属度。实验结果表明,提出的算法较好地解决了模糊核聚类算法在局部极值处收敛和在迭代过程中出现停滞等问题,最终得到最佳全局聚类,迭代次数降低明显,并具有高鲁棒性、对噪声不敏感的特点。  相似文献   

18.
邵春艳  丁庆海  罗海波  李玉莲 《红外与激光工程》2016,45(4):428002-0428002(10)
根据刚体各部位具有变换一致性这一特性,提出一种采用高维数据聚类的目标跟踪方法。从数学理论方面证明提出的度量方法可以应用于目标跟踪, 称其为高维数据聚类跟踪器(HDDC tracker)。该算法框架如下,首先, 采用Harris检测器对模板与跟踪区域进行特征提取;然后利用这些特征的空间信息对所提取的特征进行编组;接着计算模板特征组与跟踪区域特征组间的仿射变换阵;最后,采用高维数据聚类对这些仿射变换阵进行度量, 将那些相似仿射阵对应的跟踪区域作为跟踪目标。实验表明: HDDC tracker能够有效地跟踪具有仿射形变的目标,并且性能优于先进跟踪算法。  相似文献   

19.
针对腐化图像恢复不足的问题,提出一种基于PCA的非局部聚类稀疏表示模型.首先,用图像非局部自相似性来取得稀疏系数值;然后,对观测图像的稀疏编码系数进行集中聚类;最后,通过学习字典使降噪图像的稀疏编码系数接近原始图像的编码系数.实验结果表明,提出的方法在重建图像性能上较同类方法有显著提高,获得了更好的图像恢复质量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号