首页 | 本学科首页   官方微博 | 高级检索  
     

文本分割综述
引用本文:石晶. 文本分割综述[J]. 计算机工程与应用, 2006, 42(35): 155-159,171
作者姓名:石晶
作者单位:中国科学院,软件研究所,人机交互技术与智能信息处理实验室,北京,100080
基金项目:国家重点基础研究发展计划(973计划);国家自然科学基金;中国科学院软件所创新工程重大项目
摘    要:文本分割在信息提取、文摘生成、语篇解析及其他多个领域有着极为重要的应用。文本分割的对象包括静态书面文本、语音文本以及动态文本等;分割的粒度因分割的目的不同而有所区别;分割的准确性不仅需要直接评测,更需要间接评测。在大量文献的基础上,对目前常用的分割方法及评测手段进行了全面的归纳和总结,分析了文本分割技术的研究现状,指出尚存在的问题并展望研究前景。

关 键 词:文本分割  主题分割  粗分割  细分割
文章编号:1002-8331(2006)35-0155-05
收稿时间:2006-06-01
修稿时间:2006-06-01

Overview of Text Segmentation
SHI Jing. Overview of Text Segmentation[J]. Computer Engineering and Applications, 2006, 42(35): 155-159,171
Authors:SHI Jing
Affiliation:Computer Human Interaction and Intelligent Information Processing Laboratory,Institute of Software,Chinese Academy of Sciences, Beijing 100080,China
Abstract:Text segmentation is very important in information retrieval,automatic summarization,discourse analysis,and many other fields.Static written text,speech text and dynamic text can be segmented.The granularity of segmentation is varied for different purpose.Direct and indirect evaluations are applied to assess algorithms.The current work on segmentation approaches and direct evaluation methods are generalized on the basis of lots of literatures.The paper presents the status of text segmentation,points out the problems and future research.
Keywords:text segmentation    topic segmentation   coarse-grained segmentation    fine grained segmentation
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号