首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   41篇
  国内免费   2篇
  完全免费   17篇
  自动化技术   60篇
  2012年   1篇
  2011年   2篇
  2010年   1篇
  2009年   2篇
  2008年   7篇
  2007年   6篇
  2005年   5篇
  2004年   6篇
  2003年   10篇
  2002年   3篇
  2001年   1篇
  2000年   3篇
  1998年   2篇
  1997年   2篇
  1993年   1篇
  1992年   2篇
  1990年   1篇
  1989年   1篇
  1988年   3篇
  1987年   1篇
排序方式: 共有60条查询结果,搜索用时 31 毫秒
1.
文本分类中的特征抽取   总被引:53,自引:3,他引:50  
特征提取是用机器学习方法进行文本分类的重点和难点。文中比较了目前几种最常用的特征抽取方法,提出了一种改进型的互信息特征抽取方法,并在构建的实验系统中比较了这几种特征抽取方法,发现改进的特征抽取方法是有效可行的。  相似文献
2.
基于多策略的专业领域术语抽取器的设计   总被引:8,自引:0,他引:8  
杜波  田怀凤  王立  陆汝占 《计算机工程》2005,31(14):159-160
设计了一个将统计方法与规则方法相结合的专业领域内术语抽取算法。针对专业领域术语的特点,利用多种衡量字符串中各字之间结合“紧密程度”的统计量,先使用阈值分类器抽取出双字候选项;然后再对这些候选项向左右进行一定程度的扩充,从中筛选出符合要求的多字候选项;最后将所得候选项进行过滤,得到最终结果。据此实现了一个以未切分标注的生语料为输入、以专业领域术语为输出的抽取程序,在对多个领域内的语料进行测试后对实验结果进行分析,指出其中存在的问题,对未来的工作作出了展望。  相似文献
3.
一种建立中文概念分类关系的新算法   总被引:7,自引:0,他引:7  
该文总结了本体概念之间的分类关系研究现状,提出了一个通用且独立于领域的自底向上建立中文概念之间的分类关系的分级模型和算法,算法充分考虑了中文自身的特点,通过生成领域词汇的语义森林并利用现有的语义词典或机读词典进行语义森林的整合。通过实验得到了比较完整的概念间的分类关系,由此证明算法是可行的和有效的。  相似文献
4.
结合决策树方法的中文姓名识别   总被引:6,自引:2,他引:4  
中文姓名识别是自然语言处理中专名识别的一个重要的子问题,本文将中文姓名的识别过程细分为三个步骤:抽取阶段、分类阶段和消歧阶段.利用中文姓和名的用字概率信息,在文本中抽取潜在的中文姓名,以及其相关的上下文词法、语法和语义特征,并将潜在姓名是否是真实姓名的判别看作是两分类问题,并利用决策树算法来实现初步判别,最后消除初步判别结果中的歧义现象.实验结果表明,该方法的召回率和准确率都可达到90%以上.  相似文献
5.
语义网知识表示的评价标准   总被引:6,自引:1,他引:5  
基于Web具有的一些特征以及应用于语义网的知识表示语言,比较了语义网中知识表示和传统的知识表示的不同,提出了语义网知识表示的评价标准,并结合标准评价了现有的知识表示语言。  相似文献
6.
一种混合型的汉语篇章结构自动分析方法   总被引:5,自引:0,他引:5       下载免费PDF全文
张益民  陆汝占  沈李斌 《软件学报》2000,11(11):1527-1533
提出一种混合型的汉语篇章结构自动分析方法.此方法主要基于RST(rhetorical structure theory)分析、主位模式分析等多种语言学方法,还利用了向量空间模型等统计方法.提出并 实现了一种确定性RST分析算法.与其他现有方法相比,此方法具有更大的适用范围和更高的 处理精度.  相似文献
7.
基于特征的汉语词性标注模型   总被引:5,自引:0,他引:5  
在隐马尔可夫模型的基础上提出了基于词汇特征的汉语词性标注模型.此模型不但考虑系统t时刻的状态(词类)对r l时刻的状态的影响,还把t时刻的观察(词)对t l时刻的状态的影响考虑进去,使模型更加精确.由于观察的数目较大,构造观察-状态转移概率矩阵的方法难以实用,于是给观察标以特征,并训练特征-状态转移概率矩阵,使概率矩阵占用较少的存储空间,实现了模型的精确和实用性的统一.  相似文献
8.
汉语语料的切分标注加工系统   总被引:4,自引:1,他引:3  
徐菁  张辉  陆汝占 《计算机工程》2003,29(9):66-68,165
介绍了一个对汉语语料进行切分标注粗加工的系统WegPos。该系统采用前缀码分词算法,用二元语法模型进行词性标注,并利用概率统计、规则、歧义数据库、部分句法分析等多种方法的结合排除分词和标注中产生的歧义。  相似文献
9.
一个基于范例推理的机器翻译系统   总被引:4,自引:0,他引:4  
介绍了一个基于范例推理的机器翻译系统。对其核心部分范例搜索作了深入的分析。提出的新的相似度量准则使系统在保证翻译覆盖率的前提下提高了翻译的准确度,而含有抽象范例的范例库和递归抽象搜索算法提高了系统的时间效率。  相似文献
10.
基于语言建模的文本情感分类研究   总被引:4,自引:0,他引:4  
提出了一种基于语言建模的文本情感分类的方法.将文本的情感倾向标记为"赞扬"或"批评",可以为文本提供主题之外的语义信息.为此提出了从训练数据中分别估计出代表"赞扬"和"批评"两种情感倾向的语言模型,然后通过比较测试文本自身的语言模型和这两种训练好的情感模型之间的Kullback-Leibler距离,分类测试文本的思路.各个模型的参数分别选用词形特征的unigram和bigram,而相应的参数估计也分别尝试了最大似然和平滑两种策略.当在电影评论语料上和代表不同分类模型的支持向量机及朴素贝叶斯分类器进行比较时,语言建模的方法表现出了较好的分类性能和鲁棒性.  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号