首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
朱怡  宁振虎  周艺华 《计算机应用》2020,40(8):2279-2285
近年来,僵尸网络、域名挟持、钓鱼网站等仿冒域名攻击越发频繁,严重威胁着社会和个人的安全,因此仿冒域名检测已经成为网络防护的重要组成部分。当前的仿冒域名检测主要面向公共域名,检测方法以编辑距离为主,难以充分体现域名的视觉特征;此外利用域名相关信息进行判定虽然有助于提高检测效率,却会引入较大的额外开销。为此,考虑采用仅基于域名字符串的轻量级检测策略,并综合考虑字符位置、字符相似度和操作类型对域名视觉的影响,提出基于视觉特征的编辑距离算法。该算法根据仿冒域名的特点,先对域名进行预处理,然后按照字符位置、字符相似度及操作类型对字符赋予不同的权重,最后通过计算编辑距离值进行仿冒域名判定。实验结果表明,基于视觉特征的仿冒域名轻量级检测方法与基于编辑距离的判定方法相比,在阈值取1和2时,F1值分别提高了5.98%和13.56%,验证了该方法具有良好的检测效果。  相似文献   

2.
基于密度峰值和网格的自动选定聚类中心算法   总被引:1,自引:0,他引:1  
夏庆亚 《计算机科学》2017,44(Z11):403-406
针对快速搜索和发现密度峰值的聚类算法(DPC)中数据点之间计算复杂,最终聚类的中心个数需要通过决策图手动选取等问题,提出基于密度峰值和网格的自动选定聚类中心的改进算法GADPC。首先结合Clique网格聚类算法的思想,不再针对点对象进行操作,而是将点映射到网格,并将网格作为聚类对象,从而减少了DPC算法中对数据点之间的距离计算和聚类次数;其次通过改进后的聚类中心个数判定准则更精确地自动选定聚类中心个数;最后对网格边缘点和噪声点,采用网格内点对象和相邻网格间的相似度进行了处理。实验通过采用UEF(University of Eastern Finland)提供的数据挖掘使用的人工合成数据集和UCI自然数据集进行对比,其聚类评价指标(Rand Index)表明,改进的算法在计算大数据集时聚类质量不低于DPC和K-means算法,而且提高了DPC算法的处理效率。  相似文献   

3.
基于位置的路网Skyline查询可根据用户的需求及用户所处的位置,从大量数据中快速返回给用户期望的数据,但已有的道路网络技术需要计算大量的路网距离及数据点间支配关系的运算,导致查询效率较低。提出一种基于路网数据点的倒排索引查询算法DSR。通过计算少量数据点的路网距离求得最终结果,减小路网距离计算的代价,从而加快数据点间支配关系的判定,提升查询效率。在此基础上,在数据点更新情况下给出算法的动态维护,仅通过维护少量数据,DSR即可以快速地计算出Skyline集合。实验结果表明,与SSI、BSS等算法相比,该算法具有较高的查询效率,且时间性能明显提升。  相似文献   

4.
现有的概率字符串匹配算法通过计算字符串之间的最小失配字符数(编辑距离),可求出字符串之间的相似度.这些算法平等地看待模式串和文本串,虽然可求出二者之间完整的编辑距离,但并不能解决以下问题:即判断是否模式串中至少有1/p的字符顺序地出现在文本串中.基于动态规划字符串匹配算法,提出了一个改进算法.该算法通过将字符串分段,在段内执行改进的概率匹配算法可求出段内的编辑距离,再结合回溯策略可以很好地解决上述问题.该算法的复杂性要低于基本动态规划匹配算法,且在某些情况下效率更高.就问题的一般性而言,该算法可广泛地应用于计算生物学、信息安全和信号处理等诸多领域.  相似文献   

5.
改进的局部线性嵌入算法及其应用   总被引:1,自引:0,他引:1       下载免费PDF全文
局部线性嵌入算法(LLE)中常用欧氏距离来度量样本间相似度,而对于具有低维流形结构的高维数据,欧氏距离不能衡量流形上两点间相对位置关系。提出基于Geodesic Rank-order距离的局部线性嵌入算法(简称GRDLLE)。应用最短路径算法(Dijkstra算法)找到最短路径长度来近似计算任意两个样本间的测地线距离,计算Rank-order距离用于LLE算法的相似性度量。将GRDLLE算法、其他改进LLE的流形学习算法及2DPCA算法在ORL与Yale数据集上进行对比实验,对数据用GRDLLE算法进行降维后人脸识别率有所提高,结果表明GRDLLE算法具有很好的降维效果。  相似文献   

6.
针对LAEP算法存在相邻节点的定位位置相同(或相近)的问题,提出一种基于节点前进跳距期望的定位求精算法(RLAEP)。该算法在LAEP算法的基础上,首先根据每个节点的前进跳距期望挖掘出节点与其邻居节点的距离估计信息,称之为"伪测距距离";然后计算两节点在网络中的定位位置之间的距离,称之为"计算距离";最后以减小当前节点间"计算距离"与"伪测距距离"的偏差为目的迭代修正未知节点的定位位置。仿真结果表明,RLAEP算法的定位精度明显高于LAEP算法。  相似文献   

7.
汉字/字符串编辑距离和编辑路径的有效求解技术   总被引:2,自引:0,他引:2  
本文提出了一种有效的编辑距离和编辑路径求解技术,该技术不但适合于单字符字符串而且也适合于双字节汉字串的编辑距离和编辑路径的计算。它首先通过一有效的字符串相似匹配算法计算出串编辑距离,而后通过简单的二进制字位运算正确计算出串(最短)编辑路径。文章也给出了本技术的完整实现算法并分析了算法的复杂性。  相似文献   

8.
近年来,高维数据算法在诸如机器学习领域以及模式识别当中有着十分广泛的应用。降维算法的目的是为了揭示出在高维数据空间中样本数据的固有的组成特性,关注于寻找原始数据集特征表示中有价值的信息。相邻区域选择问题对流形学习降维算法的性能改进至关重要。因此,该文提出一种流形学习降维算法中的新动态邻域选择方法Mod-HLLE(modified Hessian locally linear embedding)。该方法针对Hessian布局线嵌入方法HLLE进行了考察,Mod-HLLE算法是针对高维数据的局部线性嵌入降维算法的改进。Mod-HLLE主要通过计算每个数据点的局部相邻区域参数的方式来完成测量距离和欧几里德距离的评测,再通过动态的相邻区域的尺寸大小来选择新的局部相邻区域。Mod-HLLE在非噪声干扰和噪声干扰情况下,对两类典型3D高维数据集进行降维测试。实验结果表明,Mod-HLLE可以获得很好的几何直观效果,在性能和稳定性方面都优于常见的降维算法,对其他高维数据降维算法的改进也具有很好的参考价值。  相似文献   

9.
针对第一次全国水利普查数据融合存在的问题,提出自适应编辑距离相似性度量,通过调整编辑操作权重及启发式学习权重等措施,对传统的编辑距离进行改进,提高相似性搜索的准确性,并给出基于编辑距离的水利普查数据融合的方法和流程,算法的有效性在第一次全国水利普查数据处理中得到验证。  相似文献   

10.
改进的无线传感器网络DV-Hop定位算法   总被引:1,自引:0,他引:1       下载免费PDF全文
在无线传感器网络中,DV-Hop定位算法在计算未知节点到锚节点的距离以及相邻节点跳距时存在较大误差。为此,提出一种改进的DV-Hop定位算法。在未知节点到锚节点的路径中,考虑相邻3个节点组成的夹角对距离的影响,根据邻近节点重叠度计算夹角,引入网络平均连通度计算节点间的跳距,从而更精确地计算距离。仿真结果表明,改进算法可提高节点的定位精度和覆盖率。  相似文献   

11.
基于相对位置的分布式实时协同编辑乐观锁并发控制算法   总被引:2,自引:0,他引:2  
实时分布式协同编辑系统是计算机支持的协同工作的典型应用系统,不少学者对其进行了大量的研究,其难点是协作编辑的一致性、实时性和无约束性。因此,并发控制始终是它的研究热点,目前已提出的协同编辑的并发控制算法有:传统的加锁法、tickle锁、floor控制、可逆执行(Undo/Redo)和操作转换等。传统的加锁法最突出的优点是设计和实现较为简单,能保证具体上下文的语义完整性,但是在分布式协同编辑中无法保证加锁位置的一致性。tickle锁方法适用于分节加锁的实时分布式协同编辑的并发控制,然而无法提供多个编辑者对节内的同时编辑。JCE中的协同编辑采用了floor控制方法,每个协作编者只有获得floor才能进行  相似文献   

12.
Traditional normalized tree edit distances do not satisfy the triangle inequality. We present a metric normalization method for tree edit distance, which results in a new normalized tree edit distance fulfilling the triangle inequality, under the condition that the weight function is a metric over the set of elementary edit operations with all costs of insertions/deletions having the same weight. We prove that the new distance, in the range [0, 1], is a genuine metric as a simple function of the sizes of two ordered labeled trees and the tree edit distance between them, which can be directly computed through tree edit distance with the same complexity. Based on an efficient algorithm to represent digits as ordered labeled trees, we show that the normalized tree edit metric can provide slightly better results than other existing methods in handwritten digit recognition experiments using the approximating and eliminating search algorithm (AESA) algorithm.  相似文献   

13.
This article presents a local LR error repair method that repairs syntax errors quickly by adoption of the A* algorithm that helps remove unproductive configurations. The new method also enhances the repair quality by adoption of a flexible edit strategy to support shifting symbols unrestrictedly, as well as inserting and deleting symbols, in order to repair invalid input strings. Experimental results show that the new method excels existing works in repair quality and efficiency.  相似文献   

14.
为了满足实时协同编辑对快速响应、无约束协作的要求,提出了一种基于相对位置的乐观锁机制并发控制算法.该算法引入了编辑锁和读锁,并对加锁的起始位置和编辑操作位置用相对位置表示,当锁申请成功将写进锁表或者操作发送到各协作结点时,再把它们转换成绝对位置,加锁的粒度可根据编者的需要任意选择,编者在加锁请求获得确认前,可预先进行编辑操作.应用实例表明:该算法既保证了数据维护的一致性,又具有快速响应性.  相似文献   

15.
目前电网调度生产中尚不能实现低频减载的在线实时监测,调度无法及时掌握低频减载控制负荷,给电网的安全稳定运行造成一定的安全隐患。为解决该问题,在EMS系统中开发了基于设备的动态拓扑功能,利用广度优先算法将末端设备的负荷动态拓扑到需统计的单位母线上,从而实时显示每条母线8轮低频减载值,再利用E语言文件将计算好的值传给上一级单位进行更高电压等级母线的实时统计。  相似文献   

16.
针对传统链路层安全机制不能从根本上保护无线通信系统信息传输安全的问题,提出了一种基于正交频分复用(OFDM)系统并行调制特性和物理层安全的并行插值加密算法。首先,根据OFDM系统调制的子载波数目确定插入符号个数,并通过密钥控制生成插入符号位置;然后,取出对应插入位置前后的原OFDM符号,并计算其平均值作为插入符号;最后,在反快速傅里叶变换(IFFT)后完成伪随机插值。与传统链路层安全机制相比,所提算法能实现调制符号整体加密,保证了信令、标志及数据信息的安全,并有效降低了算法实现复杂度。仿真实验结果表明,该算法能有效抵抗各种窃听攻击,对通信系统固有性能影响小,能较好地适应高斯信道和多径信道,且表现出一定的抗多径衰落能力。  相似文献   

17.
String similarity join (SSJ) is essential for many applications where near-duplicate objects need to be found. This paper targets SSJ with edit distance constraints. The existing algorithms usually adopt the filter-andrefine framework. They cannot catch the dissimilarity between string subsets, and do not fully exploit the statistics such as the frequencies of characters. We investigate to develop a partition-based algorithm by using such statistics. The frequency vectors are used to partition datasets into data chunks with dissimilarity between them being caught easily. A novel algorithm is designed to accelerate SSJ via the partitioned data. A new filter is proposed to leverage the statistics to avoid computing edit distances for a noticeable proportion of candidate pairs which survive the existing filters. Our algorithm outperforms alternative methods notably on real datasets.  相似文献   

18.
《Pattern recognition letters》2002,23(1-3):203-213
An algorithm to compute the mean shape, when the shape is represented by a string, is presented as a modification of the well-known string edit algorithm. Given N strings of symbols, a string edit sequence defines a mapping between their corresponding symbols. We transform these sets of mapped symbols (edges) into piecewise linear functions and we compute their mean. To transform them into functions, we use the equation of the line defining their edges, and the percentage of their length, in order to have a common parameterization. The algorithm has been experimentally tested in the computation of a representative among a class of shapes in a clustering procedure in the domain of a graphics recognition application.  相似文献   

19.
20.
两字符串的编辑距离是从一个串转换到另一个串所需要的最少基本操作数。编辑距离广泛应用于字符串近似匹配、字符串相似连接等领域。动态规划法利用编辑距离矩阵来计算两个串的编辑距离,需要计算矩阵中的所有元素,时间效率低。改进的方法改变了矩阵中元素的计算次序,减少了需要比对的元素,但仍需要比对一半以上的元素,时间效率还有待提高。提出基于基本操作序列的编辑距离顺序验证方法。首先,分析了基本操作序列的可列性,给出了列举基本操作序列的方法。然后依次顺序验证基本操作数从小到大的基本操作序列直到某一序列通过验证,得到其编辑距离。在阈值为2的字符串近似搜索实验中发现,所提方法比动态规划类方法具有更高的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号