首页 | 本学科首页   官方微博 | 高级检索  
     

基于多元判别分析的文本分割模型
引用本文:朱靖波,叶娜,罗海涛.基于多元判别分析的文本分割模型[J].软件学报,2007,18(3):555-564.
作者姓名:朱靖波  叶娜  罗海涛
作者单位:东北大学,计算机软件研究所,辽宁,沈阳,110004
基金项目:国家自然科学基金;国家高技术研究发展计划(863计划);教育部跨世纪优秀人才培养计划;面向21世纪教育振兴行动计划(985计划)
摘    要:提出了一种独立于具体领域的文本线性分割统计模型,其中采用多元判别分析方法定义了4种全局评价函数,实现对文本分割模式的全局评价,寻找满足分割单元内距离最小化和分割单元间距离最大化条件的最好分割方式.该模型采用遗传算法来解决新模型的高计算复杂度问题.比较性实验结果显示,新模型比TextTiling和Dotplotting算法取得了更高的Pμ评价性能.

关 键 词:文本分割  多元判别分析  分割单元内距离  分割单元间距离  分割单元长度  遗传算法
收稿时间:2005-11-29
修稿时间:2006-01-24

Text Segmentation Model Based on Multiple Discriminant Analysis
ZHU Jing-Bo,YE Na and LUO Hai-Tao.Text Segmentation Model Based on Multiple Discriminant Analysis[J].Journal of Software,2007,18(3):555-564.
Authors:ZHU Jing-Bo  YE Na and LUO Hai-Tao
Affiliation:Institute of Computer Software and Theory, Northeastern University, Shenyang 110004, China
Abstract:
Keywords:text segmentation  multiple discriminant analysis  within-segment distance  between-segment distance  segment unit length  genetic algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号