首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   104篇
  国内免费   4篇
  完全免费   73篇
  自动化技术   181篇
  2022年   4篇
  2021年   3篇
  2020年   2篇
  2019年   3篇
  2018年   3篇
  2016年   6篇
  2015年   9篇
  2014年   11篇
  2013年   6篇
  2012年   22篇
  2011年   14篇
  2010年   16篇
  2009年   17篇
  2008年   9篇
  2007年   14篇
  2006年   16篇
  2005年   5篇
  2004年   1篇
  2003年   7篇
  2002年   5篇
  2001年   3篇
  2000年   1篇
  1999年   1篇
  1998年   1篇
  1997年   2篇
排序方式: 共有181条查询结果,搜索用时 62 毫秒
1.
决策树的优化算法   总被引:78,自引:1,他引:77       下载免费PDF全文
刘小虎  李 生 《软件学报》1998,9(10):797-800
决策树的优化是决策树学习算法中十分重要的分支.以ID3为基础,提出了改进的优化算法.每当选择一个新的属性时,算法不是仅仅考虑该属性带来的信息增益,而是考虑到选择该属性后继续选择的属性带来的信息增益,即同时考虑树的两层结点.提出的改进算法的时间复杂性与ID3相同,对于逻辑表达式的归纳,改进算法明显优于ID3.  相似文献
2.
文档中词语权重计算方法的改进   总被引:56,自引:5,他引:51  
文本的形式化表示一直是文本检索、自动文摘和搜索引擎等信息检索领域关注的基础性问题。向量空间模型(Vector Space Model) 中的tf.idf文本表示是该领域里得到广泛应用并且取得较好效果的一种文本表示方法。词语在文本集合中的分布比例量上的差异是决定词语表达文本内容的重要因素之一,但现在tf.idf方法无法把握这一因素。针对这个问题,本文引入信息论中信息增益的概念,提出一种对tf.idf的改进方法tf.idf.IG文本表示方法。该方法将词语的信息增益作为一个文本表示的一个因子,来衡量词语在文本集合中分布比例在量上的差异。在文本分类实验中,tf.idf.IG文本表示的向量空间模型的分类效果要好于tf.idf方法,验证了改进方法tf.idf.IG的有效性和可行性。  相似文献
3.
一种基于向量空间模型的多层次文本分类方法   总被引:39,自引:2,他引:37  
本文研究和改进了经典的向量空间模型(VSM)的词语权重计算方法,并在此基础上提出了一种基于向量空间模型的多层次文本分类方法。也就是把各类按照一定的层次关系组织成树状结构,并将一个类中的所有训练文档合并为一个类文档,在提取各类模型时只在同层同一结点下的类文档之间进行比较;而对文档进行自动分类时,首先从根结点开始找到对应的大类,然后递归往下直到找到对应的叶子子类。实验和实际系统表明,该方法具有较高的正确率和召回率。  相似文献
4.
决策树学习算法ID3的研究   总被引:27,自引:0,他引:27  
ID3是决策树学习的核心算法,为此详细叙述了决策树表示方法和ID3决策树学习算法,特别说明了决策属性的选取法则。通过一个学习实例给出该算法第一选取决策属性的详细过程,并且对该算法进行了讨论,一般情况下,ID3算法可以找出最优决策树。  相似文献
5.
自然语言处理中词语上下文有效范围的定量描述   总被引:27,自引:0,他引:27  
鲁松  白硕 《计算机学报》2001,24(7):742-747
词语的上下文(context)是语料库语言学中自然语言知识获取和解决自然语言处理中多种实际应用问题必须依靠的资源和基础,但上下文“窗口”开多大为宜呢?为克服当前仅凭主观经验或通过某一特定应用问题中最终结果正确率界定上下文有效范围的不足,我们在引入信息增益方法确定上下文各位置的信息量后,构造上下文位置信息量函数,最终通过多项式积分确定85%信息量的上下文边界,即汉语核心词语最近距离[-8,+9]和英文[-16,+13]位置之间的上下文范围,该文的结果对上下文在自然语言处理中的价值和作用提出了一个具有统计意义的量化解释。  相似文献
6.
基于决策树的医疗数据分析   总被引:10,自引:0,他引:10  
刘昆  刘业政 《计算机工程》2002,28(2):41-43,78
介绍了决策树的概念和生成过程,仔细研究了决策树的几种技术,并将它们集成到作者的决策树分析系统中,在分析了医疗数据之内后,提出了今后决策树研究的一个重要方向。  相似文献
7.
应用统计方法综合评估核函数分类能力的研究   总被引:8,自引:0,他引:8  
王泳  胡包钢 《计算机学报》2008,31(6):942-952
应用统计方法对支持向量机方法中核函数选择问题进行了研究.文中将"纠正重复取样t测试"引入到核函数选择中,通过其与k-折交叉验证、配对t测试等多种统计方法的综合应用,对9个常用核函数的分类能力进行了定量研究.同时,文中还提出了基于信息增益的评估核函数模式识别能力的定量评估准则,证明了该准则是传统评估准则的非线性函数.数值实验表明,不同模型评估准则之间存在差异,但应用统计方法可以从这些差异中发现一些规律.同时,不同统计方法之间也存在显著差异,且这种差异对模型评估的影响要大于由于评估准则的不同而产生的影响.因此,只有应用综合的评估方法和准则才能对不同核函数的分类能力进行客观评估.  相似文献
8.
自动文本分类特征选择方法研究   总被引:8,自引:4,他引:4  
文本分类是指根据文本的内容将大量的文本归到一个或多个类别的过程,文本表示技术是文本分类的核心技术之一,而特征选择又是文本表示技术的关键技术之一,对分类效果至关重要。文本特征选择是最大程度地识别和去除冗余信息,提高训练数据集质量的过程。对文本分类的特征选择方法,包括信息增益、互信息、X^2统计量、文档频率、低损降维和频率差法等做了详细介绍、分析、比较研究。  相似文献
9.
一种基于信息增益及遗传算法的特征选择算法   总被引:8,自引:0,他引:8       下载免费PDF全文
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集。针对此问题,本文提出一种综合了filter模型及wrapper模型的特征选择方法,首先基于特征之间的信息增益进行特征分组及筛选,然后针对经过筛选而精简的特征子集采用遗传算法进行随机搜索,并采用感知器模型的分类错误率作为评价指标。实验结果表明,该算法可有效地找出具有较好的线性可分离性的特征子集,从而实现降维并提高分类精度。  相似文献
10.
基于信息增益的特征词权重调整算法研究   总被引:7,自引:0,他引:7       下载免费PDF全文
传统权重公式TFIDF忽略了词语在集合中的分布比例,针对TFIDF的这个缺点,把信息增益公式引入文本集合中并提出IF*IDF*IG,取得了较好的效果。在分析中发现单纯把信息增益引入文本集合并不能完全解决词语分布对词语权重的影响。从文档类别层次上考虑,把信息论中信息增益应用到文本集合的类别层次上,提出了一种改进的权重公式tf*idf*IGc,用改进的权重公式来衡量词语在文本集合的各个类别中分布比例上的差异,进一步弥补传统公式的不足。实验对比了改进的公式tf*idf*IGc和IF*IDF*IG的实验效果,实验证明tf*idf*IGc权重公式在表现词语权重时更有效。  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号