首页 | 本学科首页   官方微博 | 高级检索  
     

基于同现度和自学习的中文字符组合发现
引用本文:李乐强,唐常杰,左劼,邱源枞,段磊,李川.基于同现度和自学习的中文字符组合发现[J].计算机研究与发展,2007,44(Z3):268-272.
作者姓名:李乐强  唐常杰  左劼  邱源枞  段磊  李川
作者单位:四川大学计算机学院,成都,610065
基金项目:国家自然科学基金 , 高等学校博士学科点专项科研项目
摘    要:中文字符组合的发现在文本数据挖掘和信息聚类中有重要作用.目前的方法已不能适应新的需求.为了解决这一问题,做了以下工作:1)分析了现有方法的不足;2)提出了新的基于同现的概率公式和中文字符组合发现算法;3) 采用数据挖掘技术,为字符组合发现引入了自学习和迭代的机制.实验表明,和传统方法相比新方法准确率提高6%~8%,运行时间减少50%.

关 键 词:中文字符组合  发现  同现  自学习  自学习  中文  字符组合  发现算法  Based  Groups  Chinese  Character  运行时间  准确率  实验  机制  迭代  挖掘技术  数据挖掘  公式  概率  分析  工作  问题  需求
修稿时间:2007年7月5日

Discovery of Chinese Character Groups Based on Co-Occurrence and Self-Learning
Li Leqiang,Tang Changjie,Zuo Jie,Qiu Yuancong,Duan Lei,Li Chuan.Discovery of Chinese Character Groups Based on Co-Occurrence and Self-Learning[J].Journal of Computer Research and Development,2007,44(Z3):268-272.
Authors:Li Leqiang  Tang Changjie  Zuo Jie  Qiu Yuancong  Duan Lei  Li Chuan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号