首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   6449篇
  国内免费   462篇
  完全免费   2774篇
  自动化技术   9685篇
  2018年   56篇
  2017年   200篇
  2016年   175篇
  2015年   384篇
  2014年   721篇
  2013年   638篇
  2012年   731篇
  2011年   730篇
  2010年   780篇
  2009年   842篇
  2008年   898篇
  2007年   1000篇
  2006年   596篇
  2005年   541篇
  2004年   369篇
  2003年   262篇
  2002年   189篇
  2001年   107篇
  2000年   108篇
  1999年   81篇
  1998年   55篇
  1997年   42篇
  1996年   30篇
  1995年   35篇
  1994年   24篇
  1993年   16篇
  1992年   19篇
  1991年   15篇
  1990年   15篇
  1989年   22篇
  1988年   4篇
排序方式: 共有9685条查询结果,搜索用时 46 毫秒
1.
Web文本挖掘技术研究   总被引:215,自引:1,他引:214  
作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术,Web挖掘正悄然兴起,倍受关注,目前,Web挖掘的研究正处于发我统一的结论,需要国内外学者在理论上开展更多的讨论,同时,Web挖掘系统的开发对其研究也将起到很大推进作用,首先探讨了Web挖掘的有关理论,从Web挖掘的定义、Web挖掘与Web信息检索的关系、Web信息检索的关系、Web挖掘任务的分类与功能等方面加以阐述,然后重点分析了  相似文献
2.
基于向量空模型的文本自动分类系统的研究与实现   总被引:150,自引:11,他引:139  
随着网络信息的迅猛发展,信息处理已经成为人工获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程。对文本分类中所涉及的关键技术,包括向量空间模型、特征提取、机器学习方法等进行了研究和探讨,并且提出了基于向量空间模型的文本分类系统的结构,并给出了评估方法和实验结果。  相似文献
3.
中文文本分类中特征抽取方法的比较研究   总被引:101,自引:9,他引:92  
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响.考察了文档频率DF、信息增益IG、互信息MI、χ2分布CHI四种不同的特征选取方法.采用支持向量机(SVM)和KNN两种不同的分类器以考察不同抽取方法的有效性.实验结果表明,在英文文本分类中表现良好的特征抽取方法(IG、MI和CHI)在不加修正的情况下并不适合中文文本分类.文中从理论上分析了产生差异的原因,并分析了可能的矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法.最后通过实验验证组合特征抽取方法的有效性.  相似文献
4.
基于机器学习的文本分类技术研究进展   总被引:94,自引:1,他引:93       下载免费PDF全文
苏金树  张博锋  徐昕 《软件学报》2006,17(9):1848-1859
文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.提出了基于机器学习的文本分类技术所面临的互联网内容信息处理等复杂应用的挑战,从模型、算法和评测等方面对其研究进展进行综述评论.认为非线性、数据集偏斜、标注瓶颈、多层分类、算法的扩展性及Web页分类等问题是目前文本分类研究的关键问题,并讨论了这些问题可能采取的方法.最后对研究的方向进行了展望.  相似文献
5.
中文文本分类中的特征选择研究   总被引:78,自引:3,他引:75  
本文介绍和比较了八种用于文本分类的特征选择方法,其中把应用于二元分类器中的优势率改造成适用于多类问题的形式,并提出了一种新的类别区分词的特征选择方法,结合两种不同的分类方法:文本相似度方法和Nave Bayes方法,在两个不同的数据集上分别作了训练和测试,结果表明,在这八种文本特征选择方法中,多类优势率和类别区分词方法取得了最好的选择效果.其中,当用Nave Bayes分类方法对各类分布严重不均的13890样本集作训练和测试时,当特征维数大于8000以后,用类别区分词作特征选择得到的宏F1值比用IG作特征选择得到的宏F1值高出3%~5%左右.  相似文献
6.
决策树的优化算法   总被引:76,自引:1,他引:75       下载免费PDF全文
刘小虎  李 生 《软件学报》1998,9(10):797-800
决策树的优化是决策树学习算法中十分重要的分支.以ID3为基础,提出了改进的优化算法.每当选择一个新的属性时,算法不是仅仅考虑该属性带来的信息增益,而是考虑到选择该属性后继续选择的属性带来的信息增益,即同时考虑树的两层结点.提出的改进算法的时间复杂性与ID3相同,对于逻辑表达式的归纳,改进算法明显优于ID3.  相似文献
7.
向量空间法中单词权重函数的分析和构造   总被引:75,自引:3,他引:72  
文本分类是文本挖掘的基础与核心,是近年来数据挖掘和网络挖掘的一个研究热点,在传统的情报检索、网站索引体系结构的建立和Web信息检索等方面占有重要地位,深入分析了一种简单而常用的经典文本分类模型--向量空间模型(vector space model,VSM)--的实质,找出了其分类精度低的原因,提出了一种利用特征筛选中的评估函数代替IDF函数进行权值调整的方法,并对采用各种不同评估函数进行权值调整的性能进行了理论分析和实验比较,提出了一种构造新的高性能评估函数的新颖方法。  相似文献
8.
基于支持向量机与无监督聚类相结合的中文网页分类器   总被引:74,自引:0,他引:74  
提出了一种将支持向量机与无监督聚类相结合的新分类算法,给出了一种新的网页表示方法并应用于网页分类问题。该算法首先利用无监督聚类分别对训练集中正例和反例聚类,然后挑选一些例子训练SVM并获得SVM分类器,任何网页可以通过比较其与聚类中心的距离决定采用无监督聚类方法或SVM分类器进行分类。该算法充分利用了SVM准确率高与无监督聚类速度快的优点。实验表明它不仅具有较高的训练效率,而且有很高的精确度。  相似文献
9.
自动问答综述   总被引:73,自引:9,他引:64  
自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取。本文分别介绍了这三个主要组成部分的主要功能和常用的方法。最后还介绍了自动问答系统的评价问题。  相似文献
10.
基于内容的垃圾邮件过滤技术综述   总被引:67,自引:3,他引:64  
垃圾邮件问题日益严重,受到研究人员的广泛关注.基于内容的过滤是当前解决垃圾邮件问题的主流技术之一.目前基于内容的垃圾邮件过滤主要包括基于规则的方法和基于概率统计的方法.本文综述了目前用于垃圾邮件过滤研究的各种语料和评价方法,并总结了目前使用的垃圾邮件过滤技术以及它们之间的对比实验,包括Ripper、决策树、Rough Set、Rocchio、Boosting、Bayes、kNN、SVM、Winnow等等.实验结果表明,Boosting、Flexible Bayes、SVM、Winnow方法是目前较好的垃圾邮件过滤方法,它们在评测语料上的结果已经达到很高水平,但是,要走向真正实用化,还有很多的工作要做.  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号