首页 | 本学科首页   官方微博 | 高级检索  
     

基于词干的混合策略维吾尔语文本聚类特征选择方法研究
引用本文:刘源,吐尔根·依布拉音,阿力木江·艾沙,张亚军. 基于词干的混合策略维吾尔语文本聚类特征选择方法研究[J]. 计算机应用与软件, 2012, 0(12): 30-32,50
作者姓名:刘源  吐尔根·依布拉音  阿力木江·艾沙  张亚军
作者单位:新疆大学信息科学与工程学院;新疆大学现代教育技术中心;昌吉学院计算机工程系
基金项目:国家自然科学基金项目(60663006);国家社会科学基金项目(10AYY006);新疆维吾尔自治区高校科研计划青年教师科研基金项目(XJEDU2011S42);昌吉学院科研基金项目(2011SSQD029)
摘    要:维吾尔语文本聚类中特征选择对聚类的效率和效果都有直接影响。根据维吾尔语构词法规律,在原有基于文档频率特征选择算法基础上,提出新的维吾尔语文本聚类的特征提取算法。新方法将词干作为文本的特征项,在原算法上融合了基于特征贡献度的选择方法,并使用Java语言实现了一个维吾尔语文本聚类系统。使用该系统在人工分类的文本集上进行实验,结果表明:新的特征提取算法有效地降低了文本向量空间维度,在准确率、召回率和F-Measure等指标方面均有不同程度提高。

关 键 词:文本聚类  维吾尔语  特征选择

ON STEM-BASED FEATURE SELECTION ALGORITHM WITH MIXED POLICIES FOR UYGHUR TEXT CLUSTERING
Liu Yuan,Turgun Ibrahim,Alim Asha,Zhang Yajun. ON STEM-BASED FEATURE SELECTION ALGORITHM WITH MIXED POLICIES FOR UYGHUR TEXT CLUSTERING[J]. Computer Applications and Software, 2012, 0(12): 30-32,50
Authors:Liu Yuan  Turgun Ibrahim  Alim Asha  Zhang Yajun
Affiliation:1(School of Information Science and Technology,Xinjiang University,Urumqi 830046,Xinjiang,China) 2(College of Modern Educational Technology,Xinjiang University,Urumqi 830046,Xinjiang,China) 3(Department of Computer Engineering,Changji University,Changji 831100,Xinjiang,China)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号