排序方式: 共有73条查询结果,搜索用时 15 毫秒
1.
中文文本分类中的特征词抽取方法 总被引:6,自引:4,他引:2
李晓红 《计算机工程与设计》2009,30(17)
针对目前各类主流的中文文本特征词抽取方法中只关心词频信息却不关注特征的位置这一现象,给出了位置权重的概念,对以往提出的无词典分词算法进行了适当的修改,并在此基础上提出将信息增益、卡方统计和互信息这3种常用的特征选择方法有机的结合起来,构成新的特征选择方法.这种新方法综合考虑了特征的各类信息,从而更加准确地选取文本中的有效特征词,并且试验结果也验证了这种改进算法的可行性和有效性. 相似文献
2.
3.
维基百科词条编辑特性研究 总被引:1,自引:0,他引:1
针对维基百科词条编辑特性问题,以网络化数据挖掘思想方法为指导,对高质量维基百科词条进行文本分析,判断词条相邻版本间句子差异,以编辑者为节点,编辑者间编辑交互关系为连边,构建词条编辑交互网络,通过分析网络结构特征实现词条编辑特性分析。分析表明网络具有小世界特性,度分布与强度分布相似,具有较强正相关性,其累积分布与边权重分布服从幂律分布,节点度与聚集系数具有较强负相关性,最短路径长度分布与高斯分布相似,网络具有异配性和较弱的互惠性,编辑群体具有较强异质性、抱团性;深化了对词条编辑交互过程和群体智能的认识。 相似文献
4.
5.
徐山 《盐城工业专科学校学报》2005,18(4):63-64,83
东汉王符《潜夫论》中的并列复词相当丰富,出现了许多新词新义,然《汉语大词典》存在着对《潜夫论》并列复词未收录的问题;对相关并列复词进行考释。 相似文献
6.
10月20日,法国道达尔首席执行官兼董事长马哲睿的飞机在俄罗斯伏努科沃失事,机上4人全部死亡.两天之后,百度百科新增加了一个人名词条的解释,帕特里克·普亚纳(Patrick Pouyanne).他就是新上任的法国道达尔公司的首席执行官.就像词条上只有简单的三句话介绍仍待补充编辑一样,这位接替马哲睿执掌道达尔帝国的新任执行官充满了神秘感,同样充满神秘感的是他会领导道达尔走一条什么样的道路. 相似文献
7.
8.
郑宏萍 《重庆工业高等专科学校学报》2010,(6):128-129
对“青海藏毯国际展览会”现有的译名进行了分析,根据该展览会的由来,尤其是“青海藏毯”这一特定名称的由来,指出其翻译中的不当之处,并提出了恰当的译名。 相似文献
9.
中文分词词典是中文自动分词的一个核心技术,词条的完备率和词典的结构,在一定程度上决定着分词的正确率和查询速度.为了提高以上两方面的性能,从计算机技术层面上讨论,给出两种改进的词典组织结构和一种自动扩充词条的方法. 相似文献
10.
《烹饪实用辞典〈汉英对照〉》是以中国烹饪常用词汇和专业术语为主的分类词辞典.具有一般中国烹饪辞典和汉英烹饪辞典两种功能。所有词条都有英译文和汉语解释部分词条有英语解理本词典具体分为概论、营养卫生保健原料器具设备、烹调工艺、面点工艺、成品菜名七个部分。 相似文献