首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
LDA是对主题到文档的全局结构建模,但其特征中缺少文档内部的局部词之间的关系,只能获得稀疏特征。Word2vec是一种基于上下文预测目标词的词嵌入模型,然而,基于这种方法只能以局部信息表示文档特征,缺乏全局信息。LDA和Word2vec的文本表示模型是基于主题向量和文档向量计算新的特征表示文本,但直接计算所得的稀疏主题特征与基于词向量的文档特征的距离,缺乏特征的一致性。本文提出了Huffman-LDA和Weight-Word2vec的文本表示模型,首先,使用LDA模型得到主题向量后构建主题哈夫曼树,再运用梯度上升方法更新主题向量,新的主题向量包含不同主题词之间的关系,求得的特征不再具有稀疏性;然后,使用LDA主题向量与主题矩阵中词的主题特性计算词权重更新Word2vec的词向量,使得词向量包含主题词之间的关系进而表示文档向量;最后,通过主题向量和文档向量的欧式距离得到具有强分类特征的文本表示。实验结果表明,该方法可获得更强的文本表示特征,有效提高文档分类精度。  相似文献   

2.
基于混沌序列构造测量矩阵优化算法   总被引:1,自引:0,他引:1  
针对混沌序列具有良好伪随机性的特点来构造测量矩阵,提出了两种基于调整混沌测量矩阵列向量顺序的优化算法。第一种具体方法是通过对信号稀疏向量中系数的分析,针对恢复信号贡献值最大的系数,设计选用混沌自适应测量矩阵最优的向量去采样。另外提出一种对稀疏向量通过不均匀进行采样的方法。实验结果表明:采用混沌测量矩阵通过理论证明可行性和实验仿真结果证明恢复效果比随机测量矩阵更好,并且两种优化算法在相同的压缩比下能显著地提高信号恢复的效果。  相似文献   

3.
为了实现稀疏信号的有效采样与完整重构,结合多测量向量模式,提出了一种针对稀疏信号的周期非均匀采样与重构方法。根据周期非均匀采样需要多个采样通道的特点,利用联合子空间理论将采样与重构转换为矩阵向量运算。利用多测量向量确定非零行向量的位置参数并分析了多测量向量模式在周期非均匀采样系统中的完整重构条件并通过插值器实现信号完整重构,使其能在数字系统中应用。最后,分别从可完整重构概率和系统整体验证两个方面证明了该方法能够实现稀疏信号的采样与重构。  相似文献   

4.
概念向量空间模型在智能答疑系统中的应用   总被引:1,自引:0,他引:1  
为解决智能答疑系统中因词的同义或多义现象而导致的“漏答”或“错答”问题,采用概念向量空间模型来计算句子相似度。针对概念向量空间模型生成的向量矩阵空间仍是一个稀疏大空间的缺点,提出了一种基于FAQ的概念向量空间模型来降低向量矩阵空间的维数。通过对基于事实的简单陈述问题的提问,结果显示明显优于向量空间模型。  相似文献   

5.
为提高网络流量矩阵测量的精度,在压缩感知框架下提出一种稀疏度自适应的网络流量矩阵测量方法.通过对网络流量矩阵的主成分分析及奇异值归一化处理寻找信号支撑集选择的判定阈值,利用网络流量矩阵重构过程中的残差L2范数匹配计算各测量时间点上网络流量矩阵的稀疏度,减小由于网络流量矩阵近似稀疏表示以及稀疏度选择不准确造成的测量误差.仿真实验结果表明:所提出的方法与现有方法相比能够获得更小的空间相对误差和时间相对误差.通过稀疏度自适应选择方法,能够有效提高网络流量矩阵的测量精度.  相似文献   

6.
针对压缩感知理论中通用的测量矩阵(如随机高斯、伯努利等)不具有最优性能保证的问题,本文通过引入奇异值分解,提出基于奇异值分解的测量矩阵优化方法,对压缩感知中一般线性测量模型中的测量矩阵与测量向量进行优化,再利用优化后的测量矩阵与测量向量重建原稀疏信号。经典的随机高斯测量矩阵和伯努利测量矩阵的数值实验结果表明本文提出的方法可以显著地提高重建成功恢复概率以及对高斯噪声的鲁棒性。该方法适用于一般线性测量系统,成功地实现了测量矩阵和重建矩阵的分离,可在不改变前端测量模型的前提下使重建矩阵接近最优配置。  相似文献   

7.
区分矩阵是属性约简的一种有效方法。针对不完备的决策系统,定义了区分矩阵的概念,给出了区分矩阵构造方法,并根据区分矩阵稀疏性的特点,定义了区分向量的概念,在此基础上,给出了一种基于区分向量的不完备决策系统属性约简算法。最后,采用恒星光谱数据,实验验证了该算法的有效性。  相似文献   

8.
为了对分类最小二乘支持向量机实施有效的稀疏化,以提高分类速率,采用分类相关分析算法,按序提取样本核矩阵的全部分类相关成分,并依据样本核矩阵各列与分类相关成分的相关性,对训练集所有个体按分类的重要性排序,进而可选取最重要的部分个体作为支持向量,并将其余非支持向量的信息转移至支持向量,以提高支持向量的分类表达能力.由此构建一种新的稀疏型最小二乘支持向量机CS LSSVM,并将其应用于多个模式分类的实际问题.测试结果表明,CS LSSVM稀疏性很强,且保持了标准LSSVM的分类性能,还可直接适用于多类问题.  相似文献   

9.
为改进目前等效源法声场分离技术中存在的测点数目多、适用范围小等问题,提出一种稀疏采样方法分离相干声场。该方法首先对等效源强与重建面声压之间的传递矩阵进行奇异值分解,获取声场的一组稀疏基;然后通过等效源强建立起全息面上测量声压和测量法向振速与系数向量之间的关系;最后通过稀疏正则化求解系数向量的解,从而求出声场的分离声压和分离法向振速。数值仿真分析结果表明:在测量点数较少的情况下,该方法相对于单全息面等效源法具有更高的分离精度;同时,该方法提高了等效源向量的稀疏度,扩大了声场分离的频率范围,在较高频率下仍然具有良好的分离精度。  相似文献   

10.
为了对分类最小二乘支持向量机实施有效的稀疏化,以提高分类速率,采用分类相关分析算法,按序提取样本核矩阵的全部分类相关成分,并依据样本核矩阵各列与分类相关成分的相关性,对训练集所有个体按分类的重要性排序,进而可选取最重要的部分个体作为支持向量,并将其余非支持向量的信息转移至支持向量,以提高支持向量的分类表达能力.由此构建一种新的稀疏型最小二乘支持向量机CS LSSVM,并将其应用于多个模式分类的实际问题.测试结果表明,CS LSSVM稀疏性很强,且保持了标准LSSVM的分类性能,还可直接适用于多类问题.  相似文献   

11.
1INTRODUCTION Withthedevelopmentofcomputertechnolo gies,dataprocessing,transferringandstoringareadvancedgreatly.ButtheperformanceofI/Osub systemisnotimprovedaccordingly.SotheI/Osubsystembecomesabottleneckofthehighper formancecomputing[13].Theeffectivemethodofsolvingtheproblemreliesonsoftware,thatis,tostoreandaccessdatainparallelI/Oacrossmulti nodesofclusterintermsofsomefileallocatingstrategies[4].TheprofessionalpracticeprovesthatparallelI/Oisaneffectivemethodtoeliminatethebottleneck.T…  相似文献   

12.
基于OPNET的集群负载均衡仿真   总被引:1,自引:0,他引:1  
为了分析比较集群负载均衡中随机调度算法、轮转算法、加权轮转算法等3种基本算法,介绍了OPNET的建模方法,给出了基于OPNET进行网络仿真的建模层次和步骤,并运用OPNET建立集群系统模型,对其进行仿真测试.仿真结果表明:3种算法均能实现负载的平衡分配,在同构集群中,轮转算法有较好的负载均衡效果;但在异构的集群系统中,加权轮转算法具有最好负载均衡效果.  相似文献   

13.
一种负载均衡的无线传感器网络自适应分簇算法   总被引:2,自引:0,他引:2  
在分簇算法中,有效的簇首选取策略可以提高网络负载均衡和簇首均匀分布程度.针对簇首选取问题,文章提出了一种负载均衡的无线传感器网络自适应分簇算法,该算法使用簇半径、节点剩余能量和簇首间距作为参数选取簇首,网络中簇内成员到簇首的通信以及簇首之间的通信都基于自由空间模型的低能量衰减,簇首与Sink节点采用多跳的方式进行通信.仿真结果表明,与LEACH算法比较,该算法有效地实现了网络负载均衡和簇首均匀分布,延长了网络生存时间.  相似文献   

14.
随着电子商务的发展,电子商务企业服务器集群负载均衡问题越来越严重,为了解决粒子群算法在求解电子商务服务器集群负载均衡问题上存在的不足,提出一种改进的文化粒子群算法的服务器集群负载均衡策略.首先利用粒子群算法的主群体空间和文化算法的知识空间形成"双演化双促进"机制,提高算法全局搜索能力和运行效率;然后引入遗传算法进化机制对知识空间演化操作进行改进,最后将该算法应用于电子商务服务器集群负载均衡问题求解.经过仿真验证,改进文化粒子群算法,提高服务器集群系统资源利用率,负载更加均衡.  相似文献   

15.
By the load definition of cluster, the request is regarded as granularity to compute load and implement the load balancing in cache cluster. First, the processing power of cache-node is studied from four aspects: network bandwidth, memory capacity, disk access rate and CPU usage. Then, the weighted load of cache-node is customized. Based on this, a load-balancing algorithm that can be applied to the cache cluster is proposed. Finally, Polygraph is used as a benchmarking tool to test the cache cluster possessing the load-balancing algorithm and the cache cluster with cache array routing protocol respectively. The results show the load-balancing algorithm can improve the performance of the cache cluster.  相似文献   

16.
针对云环境下大量并行计算易导致节点负载不均影响云平台服务质量的问题,提出一种基于云环境的弹性负载均衡方案。该方案构造了负载均衡模型框架,对虚拟机负载状况和虚拟机集群资源利用率进行量化评估,并为实现虚拟机集群负载的均衡和弹性伸缩,设计了负载均衡模型和弹性伸缩算法。测试结果表明在该负载均衡机制下,新方案的用户响应时间有所改善,可相应提高资源利用率。  相似文献   

17.
服务器集群技术是解决目前网络计算瓶颈的一种有效方案,负载均衡技术是其中的关键.对Linux虚拟服务器集群的结构与原理进行讨论,重点阐述了基于网络地址转换(NAT)的负载均衡技术以及满足不同应用需要的4种负载均衡算法,并在Linux操作系统环境下构建了虚拟服务器集群,测试了负载响应、服务性能、调度器备份.结果表明,基于IP层的负载均衡技术是有效的,集群技术较大幅度地提高了系统的综合性能.  相似文献   

18.
Focusing on the data fusion problem of various loads, a fuzzy clustering based load balancing algorithm with feature weighted is proposed. First of all, various system resources are considered as dimensions for load metrics, and features for different dimensions are weighted so as to quantify comprehensive loads; then, this algorithm introduces fuzzy clustering, optimizes weight constraints, and adds penalty terms. Hence, the most suitable objective node cluster for load transferring is resolved through fuzzy clustering. Experimental results show that this algorithm can effectively fuse multidimensional load data and reduce standard deviation for node loads within the cluster by 21% compared with existing algorithms.  相似文献   

19.
集群技术为Web服务带来了新的解决方案。针对传统负载均衡算法的一些不足,提出了一种临界区加速递减权值的动态请求负载均衡算法,通过负载权值的等效变换来简化算法,最大限度满足系统最大吞吐率,减少系统响应时间。测试表明,算法达到了较好的负载均衡效果,明显优于传统算法。  相似文献   

20.
DBSCAN算法是一种典型的基于密度的聚类算法,具有速度快、可以发现噪声的优点,但在处理大规模数据时出现聚类效率低、内存和I/O消耗大、聚类精度降低的问题,集群式计算机技术特别是云计算技术的发展提供了解决DBSCAN算法缺陷的方案.文中提出了数据预分区的并行PMDBSCAN算法,该算法在聚类之前对数据分区预处理,利用并行编程模型MapReduce实现DBSCAN算法并行化,结合重叠分区思想,减少I/O消耗.实验结果表明,在大规模数据集上,PMDBSCAN算法聚类有效提高了聚类的速度、减少了I/O消耗、改善了聚类的质量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号