首页 | 本学科首页   官方微博 | 高级检索  
     

文本的图表示初探
引用本文:周昭涛,卜东波,程学旗.文本的图表示初探[J].中文信息学报,2005,19(2):37-44.
作者姓名:周昭涛  卜东波  程学旗
作者单位:1. 中国科学院计算技术研究所,北京 100080 ; 2. 中国科学院研究生院,北京 100039
基金项目:国家重点基础研究发展计划(973计划)
摘    要:文本表示是文本信息处理中的基础问题,以向量空间模型(VSM) 为代表的多数文本表示模型没有考虑文本中特征项之间的序关系,这样的表示造成文本语义信息的损失。我们尝试在文本表示中引入序关系,用图结构来表示文本,提出了一种新的文本表示模型—图表示模型,并对该模型的表示效果进行了验证。实验结果表明目前我们的表示模型仍达不到VSM模型所取得的表示效果。本文总结了文本表示过程,提出了一种新颖的用于度量文本表示模型表示能力的方法,同时也提出了一系列与文本图表示相关的值得探讨的问题。

关 键 词:计算机应用  中文信息处理  文本表示  VSM模型  图表示  
文章编号:1003-0077(2005)02-0036-08
修稿时间:2004年6月22日

Towards Graph-based Text Representation
ZHOU Zhao-Tao,BU Dong-bo,CHENG Xue-Qi.Towards Graph-based Text Representation[J].Journal of Chinese Information Processing,2005,19(2):37-44.
Authors:ZHOU Zhao-Tao  BU Dong-bo  CHENG Xue-Qi
Affiliation:1.Institute of Computing Technology ,The Chinese Academy of Science , Beijing 100080 ,China ;2.Graduate School of the Chinese Academy of Science ,Beijing 100039 ,China
Abstract:Text representation is the basis of text processing. Most text representation model didn’t consider the order of the terms in the text ,which results in the losing of text semantics. We tried to introduce order in the text , using graphic structure to represent text. In this paper , we proposed a novel text representation model named Graph Space Model (GSM) and introduced a novel way to measure the representation ability of a text representation model. We compared the ability of the Vector Space Model and our GSM. Our model didn’t excel the VSM now , but there are much more problems need to be investigated in the text representation to take back the losing semantics.
Keywords:computer application  Chinese information processing  text representation  VSM model  graph  based representation  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号