排序方式: 共有3条查询结果,搜索用时 15 毫秒
1
1.
在社交网络中查找和收集个人信息可以建立一个包含目标履历、生活、爱好以及朋友等属性的信息体系,但是不同社交网络中存在大量同名用户。为了解决同名歧义问题,采用计算用户信息相似度,可以判断2个用户是否属于同一个人。由于文档中描述信息位置颠倒会导致计算机误判,为此,本文通过对莱文斯坦(Levenshtein)和词频相关字符串频率(TFRSF)方法融合计算词频和编辑距离,判断属性值是否相同。实验结果表明,本文提出的计算文本相似度方法在多种评价指标上准确性都有所提高,准确率(Precision)、召回率(Recall)、F1值(F1 Measure)均大于87%。 相似文献
2.
Levenshtein距离在编程题自动评阅中的应用研究 总被引:1,自引:0,他引:1
周汉平 《计算机应用与软件》2011,28(5)
目前对编程题的自动评阅技术多建立在程序能正常运行的基础上.实践表明,这样的评价基础并不适用初学计算机程序语言的学生,大量的答题由于很小的编译错误而被判为零分.如何对一个无法正常运行的程序文本给出一个正确度的评价,这个课题的研究在国内外还未见有特别有效的方法.把文本相似度和程序相似度的研究成果应用于对程序文本正确度的评价上是一种新的探索.通过构造由样本程序生成的目标程序集,结合使用衡量文本相似度的Levenshtein距离,给出一个程序正确度评价方法.希望在程序文本的正确性评价方法的研究方面能有所突破. 相似文献
3.
目前智能变电站IED(Intelligent Electronic Device)虚端子连接主要为人工连接方式,由于虚端子数目多,名称相似度高,在连接IED虚端子时工作量大、效率低且易出错,因此本文研究了基于烟花算法计算莱文斯坦距离权重相似度的虚端子自动连接方法。此方法基于建立的莱文斯坦距离相似度模型,计算出虚端子相似度,建立距离权重向量优化模型,利用其他智能变电站已完成的虚连接信息,运用烟花算法训练出最佳距离权重向量,最后使待匹配IED虚端子连接成功。仿真算例表明,此方法利用已完成的同类IED虚连接信息,高效、准确的将待匹配IED虚端子自动相连。能够有效的提高智能变电站的工作效率和可靠性。 相似文献
1