首页 | 本学科首页   官方微博 | 高级检索  
     

维吾尔语比较句识别研究
引用本文:王慧云,禹 龙,田生伟,加米拉·吾守尔,冯冠军.维吾尔语比较句识别研究[J].中文信息学报,2016,30(1):148-156.
作者姓名:王慧云  禹 龙  田生伟  加米拉·吾守尔  冯冠军
作者单位:1. 新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046; 2. 新疆大学 网络中心,新疆 乌鲁木齐 830046;
3. 新疆大学 软件学院,新疆 乌鲁木齐 830008;4. 新疆大学 人文学院,新疆 乌鲁木齐 830046)
基金项目:国家自然科学基金(61262064,60963017, 61063026, 61063043,61331011,61563051); 国家社科基金资助项目(10BTQ045,11XTQ007); 自治区教育厅高等院校重点项目(XJEDU2011I08)
摘    要:识别比较句并提取被比较事物之间的关系是细颗粒度意见挖掘的重要研究内容之一。该文给出维吾尔语比较句的范畴、语法特点,定义了维吾尔语比较句识别的任务。提出两层识别模型,第一层是基于比较词的粗识别,第二层提出双向CSR挖掘算法(Bidirectional CSR Mining),以挖掘的模式为特征,利用支持向量机(SVM)筛选得到比较句,实现维吾尔语比较句的识别。实验F值达到70.93%,证明提出的两层识别模型可以有效识别维吾尔语比较句。

关 键 词:维吾尔语  比较句识别  双向CSR挖掘算法    文本分类  />  

Identification of Uyghur Comparative Sentences
WANG Huiyun,YU Long,TIAN Shengwei,Jiamila Wushouer,FENG Guanjun.Identification of Uyghur Comparative Sentences[J].Journal of Chinese Information Processing,2016,30(1):148-156.
Authors:WANG Huiyun  YU Long  TIAN Shengwei  Jiamila Wushouer  FENG Guanjun
Affiliation:1. School of Information Science and Engineering, Xinjiang University, Urumqi, Xinjiang 830046, China;
2. Network Center, Xinjiang University, Urumqi, Xinjiang 830046, China;
3. School of Software, Xinjiang University, Urumqi, Xinjiang 830008, China;
4. College of Humanities, Xinjiang University, Urumqi, Xinjiang 830046, China
Abstract:The identification of comparative sentences and the extraction of comparative relations are of substantial significance to fine-grained opinion mining. This paper outlines the famework of Uyghur comparative sentence identification, and proposes a two level identification model. A Bidirectional CSR Mining algorithm(Bi-CSR) is designed to mine sequential patterns, then the SVM classifier is applied to classify a Uyghur sentence into either “comparative” or not. The experimental results demonstrate the effectiveness of the proposed method.
Keywords:Uyghur  comparative sentences identification  bidirectional CSR mining algorithm  text classification  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号