首页 | 本学科首页   官方微博 | 高级检索  
     

基于中文分词的文本相似度动态规划算法
引用本文:肖侃,谭长庚,丁玲. 基于中文分词的文本相似度动态规划算法[J]. 现代电子技术, 2011, 34(8): 72-74,78
作者姓名:肖侃  谭长庚  丁玲
作者单位:中南大学软件学院,湖南,长沙,410075
摘    要:针对传统的基于动态规划的对论文的文本相似度计算的不足,提出了一种基于中文分词和动态规划的论文文本相似度计算方法,并对此进行了讨论。该方法克服了一般基于动态规划的计算方法所具有的效率低,判断准确率低的缺点。通过对实际中的论文数据库中论文进行测试和分析,该算法能提高计算准确率,并一定程度上提高了运算速度,可以应用于论文防抄袭系统中。

关 键 词:文本相似度  动态规划  最长公共子序列  中文分词

Dynamic Programming Algorithm of Text Similarity Calculation Based on Chinese Word Segmentation
XIAO Kan,TAN Chang-geng,DING Ling. Dynamic Programming Algorithm of Text Similarity Calculation Based on Chinese Word Segmentation[J]. Modern Electronic Technique, 2011, 34(8): 72-74,78
Authors:XIAO Kan  TAN Chang-geng  DING Ling
Affiliation:XIAO Kan,TAN Chang-geng,DING Ling(Software College,Central South University,Changsha 410075,China)
Abstract:A dynamic programming algorithm of similarity calculation of thesis texts based on Chinese word segmentation and dynamic programming are proposed and discussed to overcome the deficiency of those traditional algorithms.This algorithm solved the problems of inefficiency and low preciseness existing in traditional dynamic algorithms.The testing and analysis for the theses in a real thesis database prove that the algorithm can improve the calculation accuracy and the analysis speed in some degree,and can be ap...
Keywords:text similarity  dynamic programming  longest common subsequence  Chinese word segmentation  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号