首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   34篇
  国内免费   3篇
  完全免费   11篇
  自动化技术   48篇
  2014年   2篇
  2013年   2篇
  2012年   1篇
  2011年   1篇
  2010年   10篇
  2009年   2篇
  2008年   12篇
  2007年   7篇
  2006年   5篇
  2005年   5篇
  2002年   1篇
排序方式: 共有48条查询结果,搜索用时 46 毫秒
1.
基于分块的网页信息解析器的研究与设计   总被引:27,自引:1,他引:26  
详细介绍了网页信息解析的基本技术手段,在综合权衡优缺点的基础上,提出了针对新闻网站复杂结构页面较为有效的分块算法,并结合实际的项目需求,设计实现了网页信息解析器TVPS,实验结果表明,该解析器具有良好的性能,满足实际的需求。  相似文献
2.
话题识别与跟踪中的层次化话题识别技术研究   总被引:18,自引:0,他引:18  
话题识别与跟踪(topic detection and tracking,TDT)旨在发展一系列基于事件的信息组织技术,层次化话题识别(hierarchical topic detection,HTD)是其中一项全新的任务定义形式.通过连续的大规模评测,话题识别与跟踪已成为国际上自然语言处理尤其是信息检索领域的一个研究热点.为此.将自然语言处理与信息检索技术相结合,提出了针对事件特点的切实有效的单粒度话题识别方法,并提出了基于多层聚类的MLCS算法对话题进行层次化组织,所提出的方法具有很好的效果,在TDT2004的HTD评测中,该方法取得了第2名的成绩.  相似文献
3.
基于结构特征的nBayes双层过滤模型   总被引:6,自引:0,他引:6       下载免费PDF全文
王斌  许洪波  王申 《计算机应用》2006,26(1):191-0194
由于算法的简单和效果的出色,Nave Bayes被广泛地应用到了垃圾邮件过滤当中。通过理论与实验分析发现,结构差异较大的邮件集特征分布差异也较大,这种特征分布差异影响到了Nave Bayes算法的效果。在此基础上,论文提出了一种基于结构特征的双层过滤模型,对不同结构的邮件使用不同的Nave Bayes分类器分开训练和学习。实验分析表明,Nave Bayes使用该模型之后效果有明显的提高,已经与SVM非常接近。  相似文献
4.
基于描述复杂性的优化学习算法   总被引:3,自引:0,他引:3  
从描述复杂性的角度出发,提出了一种新的优化学习算法,描述复杂性理论认为,一个数据集的最小长度描述最能体现出这个数据集的本质规律,借鉴机器学习和认知心理学领域的研究成果,该文采用“规则+例外”作为描述方法,从而把学习问题转化成求在“规则+例外”描述方法下的最小长度描述的优化问题,实验表明,这种算法的结果能够得到很好的解释。  相似文献
5.
自动分类技术在企业竞争情报系统中的应用   总被引:3,自引:0,他引:3  
论文介绍了基于支持向量机(SVM)方法的自动分类技术,以及该项技术在企业竞争情报系统中实现情报资料自动分类的应用,通过对测试结果的评估表明,这种基于统计学习原理的自动分类方法能够达到较好的效果,实现企业情报资料智能化预处理功能。  相似文献
6.
网络文本主题词的提取与组织研究   总被引:3,自引:0,他引:3  
网络信息的指数爆炸给人们获取与掌控信息带来了困扰,为了挖掘海量信息中的关键因子并以恰当的方式进行组织,本文设计了网络文本主题词提取和组织算法。该算法基于多级滤噪的切分词拼接,利用特定的噪音库与滤噪策略严格控制拼接过程,在合理收录策略的挑选下,算法提取出了能够准确反映海量网络数据中关键因子的主题词串。为清晰地组织主题词,建立主题词与网络事件的有机联系,设计了新的词聚类策略对主题词提取结果进行处理,使表达同一热点的主题词合理地组织在一起,共同描述同一事件。在以实际网络文本为语料的实验中,算法表现出令人满意的性能。  相似文献
7.
基于网页格式信息量的博客文章和评论抽取模型   总被引:3,自引:0,他引:3       下载免费PDF全文
曹冬林  廖祥文  许洪波  白硕 《软件学报》2009,20(5):1282-1291
从信息论的角度出发,提出了一个基于网页格式信息量的博客文章和评论抽取模型.首先,结合网页视觉上的位置信息和文本的有效信息来定位网页正文.其次,利用博客网页中的格式信息作为信息单元并计算每个信息块所包含的格式信息量,通过计算最小切分位置信息量来切分正文中的文章和评论.该模型具有与语言无关的特点,因此具有一定的通用性.实验结果表明,该模型在博客正文定位和正文切分方面达到了较高的精确率.  相似文献
8.
开源软件的社会经济影响   总被引:2,自引:0,他引:2  
本文基于欧盟首个对开源软件产业的研究报告——《开源对欧盟软件通信产业竞争力和创新的影响》。通过该报告,我们可以了解欧盟对开源软件产业的研究成果.这对于规划和实施我国开源软件战略具有重大的借鉴作用。本文主要包括开源软件对社会的总体经济影响、开源软件对软件生产力的影响、开源软件对行业企业的渗透三个部分。  相似文献
9.
基于多策略优化的分治多层聚类算法的话题发现研究   总被引:2,自引:2,他引:0  
话题发现与跟踪是一项评测驱动的研究,旨在依据事件对语言文本信息流进行组织利用。自1996年提出以来,该研究得到了越来越广泛的关注。本文在研究已有成熟算法的基础上,提出了基于分治多层聚类的话题发现算法,其核心思想是把全部数据分割成具有一定相关性的分组,对各个分组分别进行聚类,得到各个分组内部的话题(微类),然后对所有的微类再进行聚类,得到最终的话题,在聚类的过程中采用多种策略进行优化,以保证聚类的效果。基于该算法的系统在TDT4中文语料上进行了测试,结果表明该算法属于目前结果最好的算法之一。  相似文献
10.
基于内容的个性化信息过滤系统的研究与设计   总被引:2,自引:0,他引:2  
以典型的向量空间模型为例,剖析了个性化信息服务中内容过滤面临的主要问题及基本对策,并结合用户的实际需求,设计实现了“天罗”个性化信息过滤系统,实验结果表明,系统达到了很高的准确率、召回率和处理速度。  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号