共查询到20条相似文献,搜索用时 156 毫秒
1.
针对中文短文本冗余问题,提出了有效的去重算法框架。考虑到短文本海量性和简短性的特点,以及中文与英文之间的区别,引入了Bloom Filter、Trie树以及SimHash算法。算法框架的第一阶段由Bloom Filter或Trie树进行完全去重,第二阶段由SimHash算法进行相似去重。设计了该算法框架的各项参数,并通过仿真实验证实了该算法框架的可行性及合理性。 相似文献
2.
3.
基于DRPKP算法的文本去重研究与应用 总被引:1,自引:0,他引:1
SimHash算法是目前主流的文本去重算法,但它对于特定行业的文本数据在主题方面的天然相似性特点并没有特殊的考虑.基于多年在金融证券行业信息管理和数据整合的经验,本文分析目前文本去重方法存在的问题,特别针对SimHash算法在特定行业文本去重中的不足,创新地提出一种基于段落主题的文本去重方法(简称DRPKP算法),通过对去重准确率、覆盖率和去重时间3个指标进行对比测试,DRPKP算法比SimHash算法准确率可提高24.5%、覆盖率可提高16.34%,且去重时间更短. 相似文献
4.
根据某试飞器发射装置改装方案,在对平衡机工作原理研究的基础上对某型导弹发射装置平衡机进行了改装设计;根据平衡机的设计原则,分析了平衡机的工作原理,计算了带弹和不带弹定向器的重量力矩,由此进行了平衡机的弹簧结构参数和平衡性能参数计算;通过对平衡力矩曲线和高低机负载曲线进行分析讨论,文章设计的方案中,平衡机的平衡力矩曲线与理想情况相符,切不平衡力矩曲线变化较为平缓,设计结果符合方案要求,且改装工作量小。 相似文献
5.
6.
针对平衡机故障的特点,采集了振动信号进行故障诊断;设计了故障信息采集系统,解决了故障信息提取困难的问题,减少了噪声信号;融合自组织(SOM)网络和变精度粗糙集(VPRS)形成了SOM-VPRS算法,实现了平衡机的故障诊断。运用SOM网络进行了连续属性的离散化,采用变精度粗糙集的近似依赖模型进行属性约简,得到故障诊断决策规则,属性约简后,属性集由20个减少为7个,规则集由70个减少为34个,计算复杂度降低;对决策规则进行了验证,诊断正确率可以达到95%以上,且模型和算法具有普遍适用性。 相似文献
7.
互联网中存在着大量的重复网页,在进行信息检索或大规模网页采集时,网页去重是提高效率的关键之一。本文在研究"指纹"或特征码等网页去重算法的基础上,提出了一种基于编辑距离的网页去重算法,通过计算网页指纹序列的编辑距离得到网页之间的相似度。它克服了"指纹"或特征码这类算法没有兼顾网页正文结构的缺点,同时从网页内容和正文结构上进行比较,使得网页重复的判断更加准确。实验证明,该算法是有效的,去重的准确率和召回率都比较高。 相似文献
8.
为了解决传统中文文本去重准确率低的问题,本文提出了一种基于语义指纹和LCS的文本去重方法。针对中文文本,预处理后抽取出文本摘要,然后使用tf-idf算法分别得出文本内容特征向量和摘要特征向量,分别将这两个向量作为simhash算法的输入,计算得到文章的内容指纹和摘要指纹。计算两个文本对应的两个指纹的汉明距离,代入本文公式,最终得到这两文本的指纹距离;使用指纹对文本对进行初步筛选,对判定为相似的两个文本使用LCS算法进行进一步对比,避免误判,最终实现中文文本快速去重。实验过程中,通过与LCS算法、simhash算法等多种算法的结果进行对比,可以体现该方法在算法精确度方面的优势,同时,该方法的运行速度优势也能较好地支持大数据量文本的去重操作。 相似文献
9.
10.
为了提升Simhash算法的文本去重效果、准确率,解决Simhash算法无法体现分布信息的缺点,提出了基于信息熵加权的Simhash算法(简称E-Simhash)。该算法引入TF-IDF和信息熵,通过优化Simhash算法中的权重及阈值计算,增加文本分布信息,使得最终生成的指纹更能体现关键信息的比重,并对指纹信息与权重的关联性进行了分析。仿真实验表明:优化权重计算能有效地提升Simhash算法的性能,E-Simhash算法在去重率、召回率、F值等方面均优于传统Simhash算法,并且在文本去重方面取得了良好的效果。 相似文献
11.
针对煤矿井下刮板输送机链条张力控制的非线性、随机性和时变性特点,提出了一种基于滑模控制的刮板输送机链条张力控制方法来改善张力控制系统的动态性能。该方法采用指数趋近律,使系统在一定特性下沿规定状态轨迹运动。仿真结果表明,采用该方法的控制系统动态特性好,鲁棒性及抗干扰能力强。 相似文献
12.
该文针对目前某些模糊控制系统在控制过程中精度比较低的问题,将模糊控制系统离线得到的模糊控制表与双线性插值算法结合起来,提出一种新的基于在线插值的模糊控制系统的设计方法,用此方法使模糊控制器输入、输出值保持连续变化,以此来克服控制器因输入输出量化所造成的调节死区与可能出现的稳态等缺点,从而来达到提高模糊控制系统控制精度的目的。在某舰船控制系统的仿真例子说明了此方法的有效性。 相似文献
13.
A new approach to the synthesis of a stabilizing control method for a multimachine power system is presented. The power system dynamics based on the usual assumptions can be formulated as a class of non-linear dynamic systems in which are contained the sinusoidal functions associated with the power torque-angle curve of the AC generator. In this theoretical scheme, an optimal control law, which retains the principal non-linearity of the system, is derived by using optimization techniques well known in linear optimal control theory. The stabilizing control of an N-synchronous machine power system with velocity governor and phase-shifter is synthesized by using the optimal control method. The usefulness of the proposed method is illustrated by the stabilizing control problem for a three-machine power system, taking into account additional control signals for the governing system and phase-shifter control systems, and simulation results are given numerically. 相似文献
14.
15.
模糊控制器在水压机控制系统中的应用 总被引:2,自引:0,他引:2
简要介绍了模糊控制中常用的二输入单输出的设计思想及方法,并采用了模糊控制的方法来改进实际生产中PID控制的一些不足.将改进方法应用在一大型水压机控制系统中并在实际生产中取得了较好效果. 相似文献
16.
Optimal Decoupling Control Method and Its Application to a Ball Mill Coal-pulverizing System 下载免费PDF全文
The conventional optimal tracking control method cannot realize decoupling control of linear systems with a strong coupling property. To solve this problem, in this paper, an optimal decoupling control method is proposed, which can simultaneously provide optimal performance. The optimal decoupling controller is composed of an inner-loop decoupling controller and an outer-loop optimal tracking controller. First, by introducing one virtual control variable, the original differential equation on state is converted to a generalized system on output. Then, by introducing the other virtual control variable, and viewing the coupling terms as the measurable disturbances, the generalized system is open-loop decoupled. Finally, for the decoupled system, the optimal tracking control method is used. It is proved that the decoupling control is optimal for a certain performance index. Simulations on a ball mill coal-pulverizing system are conducted. The results show the effectiveness and superiority of the proposed method as compared with the conventional optimal quadratic tracking (LQT) control method. 相似文献
17.
煤矿监控系统本质安全型互连认证方法研究 总被引:2,自引:0,他引:2
针对煤矿监控系统结构复杂多变、互连设备类型众多且不断增加的特点,分析了我国传统的本质安全型互连系统认证方法、国外的接口参数认证方法和系列本质安全型标准对我国煤矿监控系统本质安全型互连认证的适用性,指出目前煤矿监控系统本质安全性能的判定依据只能是GB3836.4-2000 equ IEC60079-11:1999,提出了煤矿监控系统非总线型接口设备本质安全型互连认证采用参数认证方法、总线型接口设备本质安全型互连认证目前应采用系统认证方法的方案,详细介绍了参数认证方法和系统认证方法的实施要点及未来实现总线型接口设备本质安全型互连参数认证的途径;还提出了煤矿监控系统接口设备的设计原则,以及煤矿监控系统本质安全型互连认证方法进一步的研究方向。该文有助于煤矿监控系统接口设备本质安全型互连参数认证方法的发展。 相似文献
18.
针对二维直线电机平台系统的XY轴协同控制问题,将PI与并联型无模型自适应相结合的复合控制方法应用于控制系统。该控制方法通过在每个子系统加入PI控制方法保证其稳定性,再通过并联型的无模型自适应控制方法来提高整个系统的跟踪性能,以减小系统位置误差。基于数据驱动的无模型自适应控制方法设计二维直线电机系统控制器,其优势在于无需被控系统精确数学模型,仅根据被控系统输入输出数据对系统进行控制。相比基于模型的控制方法,该方法能够减小未建模动态产生的干扰,有效提高控制精度。仿真及实物控制效果对比结果表明,这种复合控制方法明显提高了整个系统的稳定性和位置跟踪精度。 相似文献
19.