首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
针对智能电网中积累的数据量不断增加这一问题,在并行计算模型MapReduce的基础上,提出了并行的深度玻尔兹曼机训练算法,深度玻尔兹曼机是一种多层的神经网络模型,使得预测结果更加准确的同时,大大提高了计算量。同时,对算法进行了优化,解决了训练过程中频繁迭代的问题。实验结果显示,提出的算法可以大大加快电网数据分析预测模型的训练工作。  相似文献   

2.
针对多楼层指纹定位中,大规模的指纹样本使得匹配算法复杂度增加,不仅阻碍了系统的实时性,还增加了移动端的能量损耗的问题。依据仿射传播聚类算法理论对指纹库进行分块处理,可以有效减少计算量。复杂环境下的指纹样本搜索通常采用折半查找法,用于在粗定位阶段得出聚类质量最优结果对应的偏向参数,但此方法花费时间较长。在保证计算质量前提下,为了提高聚类速度,研究了其在粗定位阶段的产生与匹配过程,并给出了对折半查找法进行改进的方法。实验结果表明,对于同一样本空间进行聚类,优化后的折半查找法可以减少算法迭代次数,提高系统工作效率,所用的迭代时间74.5%以上都短于传统折半查找法。  相似文献   

3.
深度学习在事件检测任务上取得了显著的成果,但模型严重依赖于大量的标注数据. 由于事件结构化的信息和丰富的标签表示,使得获取注释的成本很高,难以大量获得. 针对事件检测任务,为了提高语料标注效率,减少训练过程所需的标注样本数量,提出一种联合主动学习和预训练模型的事件检测模型. 针对主动学习模型存在的冷启动问题,设计了基于融合不确定性的特殊样本选择策略,估计样本在微调下游事件检测任务方面的潜在贡献. 一方面,结合预训练模型从原始任务中带来的丰富的语义信息,避免了重新设计网络结构或从零开始训练; 另一方面,利用主动学习选择信息丰富的样本能更好地微调预训练模型,减少数据标注成本. 在ACE 2005语料上进行数值实验验证,结果证明了所提出的EDPAL算法的有效性.  相似文献   

4.
研究了在多址干扰存在并且不考虑功率控制情况下进行用户码时延估计的问题。利用MUSIC算法可以获得具有抗强多址干扰的时延估计算法,但计算量大,提出了一种基于共轭梯度算法,通过对接收到新样本进行迭代计算,可有效地减少计算量。  相似文献   

5.
基于动力学分析设计反馈神经网络Hopfield其离散型的优化算法,通过矩阵分解的方法(MD)得到其正交矩阵,优化算法即可直接计算Hopfield离散型神经网络的权值矩阵,并将样本信息可以较好地存储训练,使测试样本快速收敛到稳定点。相较于传统方法涉及的奇异值分解学习算法不需要分块分步计算,简化了计算步骤和计算量,迭代次数减少,运行速度提高。最后,将训练好的优化算法应用于研究流域生态演变趋势的分析,验证了其应用前景和推广价值。  相似文献   

6.
由于EM算法不适合空间聚类对空间信息的要求,而邻域EM算法虽然结合了空间惩罚项,但是NEM在E-step步需要大量的迭代.为了既能满足空间信息的要求,又能避免过多的计算量,本文提出了EM与NEM二者相结合的混合递增NEM算法,算法首先在随机子样本中进行EM训练,直到似然判断条件下降,根据增量因子进行样本更新,然后样本转向NEM训练一次,如此进行循环递增的交叉训练,使得计算量降低,性能提高.实验结果显示,MNEM只需要较少的运算便可达到收敛,聚类质量结果优于NEM.  相似文献   

7.
介绍了数据挖掘技术和CRM的基本概念,分析了数据挖掘技术在CRM中的应用,并着重对决策树技术进行了研究。针对SPRINT算法在数值型属性分裂过程中计算量大、效率低的缺点,提出了一种新的数值型属性的分裂方法,并对SPRINT算法进行了改进,并用改进的SPRINT算法构建了客户信用卡的分类模型。  相似文献   

8.
小波域隐Markov树模型(Hidden Markov Tree Model,简称HMT)能充分表现小波系数的统计特征,但模型训练算法计算量大。文中以图像去噪为应用背景,提出了基于HMT粗分类的多树训练算法。该算法通过对不同类型的纹理建立不同的HMT,对小波系数进行粗分类,在此基础上,不同类别的小波系数被分别建模,并将粗分类HMT的参数作为最终模型训练的初始化参数,从而提高了模型的精度,同时减小了训练算法的计算量。对于含复杂场景或纹理的图像,提出了基于方差粗分类的训练算法,也能有效地提高模型精度。对自然图像和SAR图像的去噪实验表明,采用粗分类训练算法的HMT去噪模型的去噪效果在客观指标上优于现有的HMT去噪模型。  相似文献   

9.
在文本分类过程中,经典的最近邻分类算法(KNN)面对海量数据时的执行时间较长.对经典KNN算法进行改进,通过在训练阶段构造初级分类器以减少训练阶段的计算量,并在Hadoop平台MapReduce下予以实现.实验结果表明,改进后的算法可以在保证分类精度的情况下节省运行时间.  相似文献   

10.
神经网络是数据挖掘中最为常用的算法之一.它具有正确率高、抗噪声数据能力强、计算错误率低等优点.但神经网络算法也存在结构相对复杂、训练时间长、计算结果的可解释度比较低等问题.文中采用粗糙集理论对数据进行预处理,使用神经规则进行数据挖掘的新方法,该方法可以在结果精度有限降低的前提下,得到表示简单明确且错误率低的关联规则,同时可以减少网络训练时间,大大改进单独采用神经网络算法给系统带来的缺陷.  相似文献   

11.
为了扩展支持向量机在大规模数据集和成批出现数据领域的应用,提出了一种基于支持向量机的增量式学习算法.利用标准的支持向量机算法训练得到初始的目标概念,通过增量式步骤不断更新初始的目标概念.更新模型是求解一个与标准支持向量机具有类似的数学形式的凸二次规划问题.证明了在可分情况下,如果新增加的样本不是位于边界区,那么增量式过程既不会改变分类平面也不会改变分类平面的表达.与现有的增量式支持向量机算法相比,该算法无需额外计算就可实现增量式的逆过程并且训练时间与增量式步骤数成反比.实验结果表明,该算法满足稳定性、能够不断改进性能以及性能回复三个准则.  相似文献   

12.
传统抗微生物肽识别分析主要通过实验手段进行,效率低,耗费较多人力物力。最新的抗微生物肽识别方法是将计算机技术和生物信息学相结合,通过机器学习方法进行大数据挖掘分析,从大量的多肽序列数据里面预测抗微生物肽,从而加快抗微生物肽的识别。收集并分类整理了近10年来计算机辅助抗微生物肽识别的研究文献,从中梳理出抗微生物肽的主要数据资源、抗微生物肽识别的特征工程、抗微生物肽的机器学习预测算法和抗微生物肽的回归分析方法。同时,进一步对机器学习算法的模型性能评估方法进行综述,总结其中存在的不足并展望了未来的发展方向。  相似文献   

13.
A new mathematical model to estimate the parameters of the probability-integral method for mining subsidence prediction is proposed. Based on least squares support vector machine (LS-SVM) theory, it is capable of improving the precision and reliability of mining subsidence prediction. Many of the geological and mining factors involved are related in a nonlinear way. The new model is based on statistical theory (SLT) and empirical risk minimization (ERM) principles. Typical data collected from observation stations were used for the learning and training samples. The calculated results from the LS-SVM model were compared with the prediction results of a back propagation neural network (BPNN) model. The results show that the parameters were more precisely predicted by the LS-SVM model than by the BPNN model. The LS-SVM model was faster in computation and had better generalized performance. It provides a highly effective method for calculating the predicting parameters of the probability-integral method.  相似文献   

14.
基于多支持向量机分类器的增量学习算法研究   总被引:1,自引:0,他引:1  
为了将一般增量学习算法扩展到并行计算环境中,提出一种基于多支持向量机分类器的增量学习算法.该算法根据多分类器对新增样本集的分类结果,以样本到分类超平面的平均距离为条件重新构造支持向量集更新分类器,直到所有分类器的分类精度满足指定阈值.实验结果表明了该算法的可行性和正确性.  相似文献   

15.
提出一种基于大数据和机器学习算法引擎的电商平台侵权动态监测网络系统的设计方案.重点介绍大数据远程采集系统、数据实时监测分析平台和核心算法引擎模型设计.大数据远程采集系统包括远程服务器云平台和大数据分布式采集程序,系统通过Web信息采集器来完成精确采集各大商家、网络平台等的所有相关数据;数据监测分析平台是将信息的深度学习...  相似文献   

16.
快速发现关联规则挖掘算法的并行化方法   总被引:1,自引:0,他引:1  
分析挖掘关联规则主要并行算法及性能.针对算法中负载平衡和时间响应问题,提出一种高效可行的挖掘关联规则的NA(Ntransactionalgorithms)并行算法,给出了NA算法的策略.通过前期实验结果表明,这种快速发现关联规则的并行算法在计算大项集过程中不需要同步和交换数据,在任意情况下,可独立计算局部大项集.  相似文献   

17.
标记分布学习中示例由多个不同重要程度的标记共同标注,而在已有的标记分布学习算法中,大部分均在完备数据集下进行,未考虑数据噪声干扰。针对这一问题,结合自编码器的降噪特性和核极限学习机的稳定性,提出一种基于核极限学习机自编码器的标记分布学习算法。使用核极限学习机自编码器对原始特征空间映射,得到更具鲁棒性的特征表达,构造适应标记分布学习的极限学习机模型作为分类器以提升分类效率及性能。试验结果表明,本文算法较其他对比算法具有一定优势,使用假设检验方法进一步说明所提算法的有效性。  相似文献   

18.
识别线上消费者群体评论的情感倾向,有助于优化平台推荐算法及提升服务质量,如何有效识别消费者情感倾向,是一个热门的研究选题。本文基于多头自注意力机制的双向长短期机制提出MABM(Multi-head self-Attention and Bidirectional long-short term Memory neural network)情感倾向识别模型,采用知名电影点评网站豆瓣点评在线评论数据作为语料,使用文本挖掘工具对数据进行预处理,以10个机器学习模型和4个深度学习模型为对照组,按照8:2划分训练集和测试集来验证对比评估MABM模型的有效性和稳健性。两组对比实验结果发现,深度神经网络模型预测效果整体优于机器学习模型,并且以MABM模型的分类效果最佳。MABM模型能够有效识别消费者评论的情感倾向,使推荐算法能有效结合消费者的心理行为,以获得更显著的营销效果。  相似文献   

19.
为保证交通检测数据的准确性并服务于实时的交通状态判别和预测,交通大数据采用多种检测源数据协同处理并利用机器学习的方法进行异常识别.异常检测数据的识别主要基于机器学习中AdaBoost方法实现.在算法的训练过程中,为消除单一检测源数据的离群现象,训练数据选取同一路段上多种检测源提供的数据集.在算法的决策过程中,通过代价敏感方法的优势来改进AdaBoost的决策.实验结果表明:基于非均衡特性改进的AdaBoost模型迫使分类器更加关注了待识别的异常样本,增强了AdaBoost决策过程中训练决策树规则的代表性,提高了异常类样本的分类准确率.高速公路实例检测数据集验证了改进算法与相关经典算法的检测准确度、误检率、误警率等指标,其中改进模型与原模型相比,准确率提高了5.547%,误检率减低了6.792%.多种算法的ROC曲线对比表明改进的AdaBoost方法筛选交通检测样本的可靠度更高,可有效调整由非平衡数据导致的分类误差.  相似文献   

20.
为了有效处理海量、高维、稀疏的大数据,提高对数据的分类效率,提出一种基于L1准则稀疏性原理的在线学习算法(a sparse online learning algorithm for selection feature, SFSOL)。运用在线机器学习算法框架,对高维流式数据的特征进行新颖的“取整”处理,加大数据特征稀疏性的同时增强了阀值范围内部分特征的值,极大地提高了对稀疏数据分类的效果。利用公开的数据集对SFSOL算法的性能进行分析,并将该算法与其它3种稀疏在线学习算法的性能进行比较,试验结果表明提出的SFSOL算法对高维稀疏数据分类的准确性更高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号