首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
针对中文短文本冗余问题,提出了有效的去重算法框架。考虑到短文本海量性和简短性的特点,以及中文与英文之间的区别,引入了Bloom Filter、Trie树以及SimHash算法。算法框架的第一阶段由Bloom Filter或Trie树进行完全去重,第二阶段由SimHash算法进行相似去重。设计了该算法框架的各项参数,并通过仿真实验证实了该算法框架的可行性及合理性。  相似文献   

2.
针对网页内容相似重复的特点,提出了一种改进算法对网页进行去重处理。该方法能够有效地对网页进行去重,并能对网页信息进行冗余识别处理。实验结果表明,与原有网页去重算法相比,该算法的执行效果提高了14.3%,对网页去重有了很明显的改善。  相似文献   

3.
基于DRPKP算法的文本去重研究与应用   总被引:1,自引:0,他引:1  
SimHash算法是目前主流的文本去重算法,但它对于特定行业的文本数据在主题方面的天然相似性特点并没有特殊的考虑.基于多年在金融证券行业信息管理和数据整合的经验,本文分析目前文本去重方法存在的问题,特别针对SimHash算法在特定行业文本去重中的不足,创新地提出一种基于段落主题的文本去重方法(简称DRPKP算法),通过对去重准确率、覆盖率和去重时间3个指标进行对比测试,DRPKP算法比SimHash算法准确率可提高24.5%、覆盖率可提高16.34%,且去重时间更短.  相似文献   

4.
根据某试飞器发射装置改装方案,在对平衡机工作原理研究的基础上对某型导弹发射装置平衡机进行了改装设计;根据平衡机的设计原则,分析了平衡机的工作原理,计算了带弹和不带弹定向器的重量力矩,由此进行了平衡机的弹簧结构参数和平衡性能参数计算;通过对平衡力矩曲线和高低机负载曲线进行分析讨论,文章设计的方案中,平衡机的平衡力矩曲线与理想情况相符,切不平衡力矩曲线变化较为平缓,设计结果符合方案要求,且改装工作量小。  相似文献   

5.
去除重复网页可以提高搜索引擎的搜索精度,减少数据存储空间。目前文本去重算法以关键词去重、语义指纹去重为主,用上述算法进行网页去重时容易发生误判。通过对字符关系矩阵进行K L展开,将每个字符映射成为一个数值,然后对这个数值序列做离散傅立叶变换,得到每个网页的傅立叶系数向量,通过比较傅立叶系数向量差异实现对网页的相似度判断。实验结果表明该方法可对网页实现较好的去重。  相似文献   

6.
针对平衡机故障的特点,采集了振动信号进行故障诊断;设计了故障信息采集系统,解决了故障信息提取困难的问题,减少了噪声信号;融合自组织(SOM)网络和变精度粗糙集(VPRS)形成了SOM-VPRS算法,实现了平衡机的故障诊断。运用SOM网络进行了连续属性的离散化,采用变精度粗糙集的近似依赖模型进行属性约简,得到故障诊断决策规则,属性约简后,属性集由20个减少为7个,规则集由70个减少为34个,计算复杂度降低;对决策规则进行了验证,诊断正确率可以达到95%以上,且模型和算法具有普遍适用性。  相似文献   

7.
互联网中存在着大量的重复网页,在进行信息检索或大规模网页采集时,网页去重是提高效率的关键之一。本文在研究"指纹"或特征码等网页去重算法的基础上,提出了一种基于编辑距离的网页去重算法,通过计算网页指纹序列的编辑距离得到网页之间的相似度。它克服了"指纹"或特征码这类算法没有兼顾网页正文结构的缺点,同时从网页内容和正文结构上进行比较,使得网页重复的判断更加准确。实验证明,该算法是有效的,去重的准确率和召回率都比较高。  相似文献   

8.
陈露  吴国仕  李晶 《软件》2014,(11):25-30
为了解决传统中文文本去重准确率低的问题,本文提出了一种基于语义指纹和LCS的文本去重方法。针对中文文本,预处理后抽取出文本摘要,然后使用tf-idf算法分别得出文本内容特征向量和摘要特征向量,分别将这两个向量作为simhash算法的输入,计算得到文章的内容指纹和摘要指纹。计算两个文本对应的两个指纹的汉明距离,代入本文公式,最终得到这两文本的指纹距离;使用指纹对文本对进行初步筛选,对判定为相似的两个文本使用LCS算法进行进一步对比,避免误判,最终实现中文文本快速去重。实验过程中,通过与LCS算法、simhash算法等多种算法的结果进行对比,可以体现该方法在算法精确度方面的优势,同时,该方法的运行速度优势也能较好地支持大数据量文本的去重操作。  相似文献   

9.
现在的互联网中存在网页重复的问题,这些问题将会使数据挖掘,搜索的复杂度加大。现有技术一些不足之处,针对互联网中的重复网页采用基于Bloom Filter的网页去重算法。使用了现有的网页去杂算法,对网页进行预处理,同时利用Bloom Filter结构大大降低了网页去重算法的时间复杂度和空间复杂度。从网页中提炼出表示网页特征的一些长句,从而把网页去重过程转换为一个搜索长句的过程,使用Bloom Filter减小了算法的时间复杂度。  相似文献   

10.
为了提升Simhash算法的文本去重效果、准确率,解决Simhash算法无法体现分布信息的缺点,提出了基于信息熵加权的Simhash算法(简称E-Simhash)。该算法引入TF-IDF和信息熵,通过优化Simhash算法中的权重及阈值计算,增加文本分布信息,使得最终生成的指纹更能体现关键信息的比重,并对指纹信息与权重的关联性进行了分析。仿真实验表明:优化权重计算能有效地提升Simhash算法的性能,E-Simhash算法在去重率、召回率、F值等方面均优于传统Simhash算法,并且在文本去重方面取得了良好的效果。  相似文献   

11.
针对煤矿井下刮板输送机链条张力控制的非线性、随机性和时变性特点,提出了一种基于滑模控制的刮板输送机链条张力控制方法来改善张力控制系统的动态性能。该方法采用指数趋近律,使系统在一定特性下沿规定状态轨迹运动。仿真结果表明,采用该方法的控制系统动态特性好,鲁棒性及抗干扰能力强。  相似文献   

12.
该文针对目前某些模糊控制系统在控制过程中精度比较低的问题,将模糊控制系统离线得到的模糊控制表与双线性插值算法结合起来,提出一种新的基于在线插值的模糊控制系统的设计方法,用此方法使模糊控制器输入、输出值保持连续变化,以此来克服控制器因输入输出量化所造成的调节死区与可能出现的稳态等缺点,从而来达到提高模糊控制系统控制精度的目的。在某舰船控制系统的仿真例子说明了此方法的有效性。  相似文献   

13.
A new approach to the synthesis of a stabilizing control method for a multimachine power system is presented. The power system dynamics based on the usual assumptions can be formulated as a class of non-linear dynamic systems in which are contained the sinusoidal functions associated with the power torque-angle curve of the AC generator. In this theoretical scheme, an optimal control law, which retains the principal non-linearity of the system, is derived by using optimization techniques well known in linear optimal control theory. The stabilizing control of an N-synchronous machine power system with velocity governor and phase-shifter is synthesized by using the optimal control method. The usefulness of the proposed method is illustrated by the stabilizing control problem for a three-machine power system, taking into account additional control signals for the governing system and phase-shifter control systems, and simulation results are given numerically.  相似文献   

14.
研究分段线性(PL)系统预测控制问题,提出了PL系统双模预测控制,并证明了该方法的稳定性.该方法使用混合逻辑动态系统来建模PL系统,利用PL系统状态反馈控制来确定PL系统的受控不变集,并结合双模预测控制方法获得PL系统双模预测控制.该方法解决了系数矩阵的选择问题,不需要满足最终状态等式约束.一个分段线性系统的实例证明了该方法是可行的.  相似文献   

15.
模糊控制器在水压机控制系统中的应用   总被引:2,自引:0,他引:2  
简要介绍了模糊控制中常用的二输入单输出的设计思想及方法,并采用了模糊控制的方法来改进实际生产中PID控制的一些不足.将改进方法应用在一大型水压机控制系统中并在实际生产中取得了较好效果.  相似文献   

16.
The conventional optimal tracking control method cannot realize decoupling control of linear systems with a strong coupling property. To solve this problem, in this paper, an optimal decoupling control method is proposed, which can simultaneously provide optimal performance. The optimal decoupling controller is composed of an inner-loop decoupling controller and an outer-loop optimal tracking controller. First, by introducing one virtual control variable, the original differential equation on state is converted to a generalized system on output. Then, by introducing the other virtual control variable, and viewing the coupling terms as the measurable disturbances, the generalized system is open-loop decoupled. Finally, for the decoupled system, the optimal tracking control method is used. It is proved that the decoupling control is optimal for a certain performance index. Simulations on a ball mill coal-pulverizing system are conducted. The results show the effectiveness and superiority of the proposed method as compared with the conventional optimal quadratic tracking (LQT) control method.   相似文献   

17.
煤矿监控系统本质安全型互连认证方法研究   总被引:2,自引:0,他引:2  
针对煤矿监控系统结构复杂多变、互连设备类型众多且不断增加的特点,分析了我国传统的本质安全型互连系统认证方法、国外的接口参数认证方法和系列本质安全型标准对我国煤矿监控系统本质安全型互连认证的适用性,指出目前煤矿监控系统本质安全性能的判定依据只能是GB3836.4-2000 equ IEC60079-11:1999,提出了煤矿监控系统非总线型接口设备本质安全型互连认证采用参数认证方法、总线型接口设备本质安全型互连认证目前应采用系统认证方法的方案,详细介绍了参数认证方法和系统认证方法的实施要点及未来实现总线型接口设备本质安全型互连参数认证的途径;还提出了煤矿监控系统接口设备的设计原则,以及煤矿监控系统本质安全型互连认证方法进一步的研究方向。该文有助于煤矿监控系统接口设备本质安全型互连参数认证方法的发展。  相似文献   

18.
针对二维直线电机平台系统的XY轴协同控制问题,将PI与并联型无模型自适应相结合的复合控制方法应用于控制系统。该控制方法通过在每个子系统加入PI控制方法保证其稳定性,再通过并联型的无模型自适应控制方法来提高整个系统的跟踪性能,以减小系统位置误差。基于数据驱动的无模型自适应控制方法设计二维直线电机系统控制器,其优势在于无需被控系统精确数学模型,仅根据被控系统输入输出数据对系统进行控制。相比基于模型的控制方法,该方法能够减小未建模动态产生的干扰,有效提高控制精度。仿真及实物控制效果对比结果表明,这种复合控制方法明显提高了整个系统的稳定性和位置跟踪精度。  相似文献   

19.
在分析了开环、闭环控制方法优劣的基础上,提出了一种速度闭环控制方法,利用高集成度混合系统级MCU芯片作为控制核心,结合一些必要的外设,设计了一个稳定性好,准确度高的速度控制系统。该系统能够有效地提高绞车运行速度的稳定性和准确性。从控制流程、控制方法、硬件实现等几个方面入手,阐述了设计思路和实现方法,并在实验室对所设计的系统进行了测试,测试结果表明该系统具有良好的速度控制效果,能够满足实际应用的要求。  相似文献   

20.
李艳东  朱玲  郭媛  于颖 《信息与控制》2019,48(6):649-657
针对带多不确定性的一组非完整移动机器人的编队控制收敛问题,提出了基于径向基函数神经网络的移动机器人多变量固定时间领航者-跟随者编队控制算法.RBFNN补偿了系统所受的多不确定性,并消除了鲁棒控制的抖振现象.基于固定时间理论和Lyapunov方法进行了控制算法设计,使所提出的控制方法保证了编队控制系统中的所有信号全局固定时间收敛,在任意系统初始条件下,在通过参数设计的固定时间内,使机器人编队达到期望编队.仿真结果显示了所提出算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号