首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   67篇
  国内免费   2篇
  完全免费   23篇
  自动化技术   92篇
  2018年   2篇
  2017年   2篇
  2016年   1篇
  2015年   8篇
  2014年   9篇
  2013年   4篇
  2012年   10篇
  2011年   6篇
  2010年   8篇
  2009年   5篇
  2008年   8篇
  2007年   10篇
  2006年   4篇
  2005年   4篇
  2004年   4篇
  2003年   4篇
  2002年   3篇
排序方式: 共有92条查询结果,搜索用时 218 毫秒
1.
基于层叠隐马模型的汉语词法分析   总被引:64,自引:2,他引:62  
提出了一种基于层叠隐马模型的汉语词法分析方法,旨在将汉语分词、词性标注、切分排歧和未登录词识别集成到一个完整的理论框架中.在分词方面,采取的是基于类的隐马模型,在这层隐马模型中,未登录词和词典中收录的普通词一样处理.未登录词识别引入了角色HMM:Viterbi算法标注出全局最优的角色序列,然后在角色序列的基础上,识别出未登录词,并计算出真实的可信度.在切分排歧方面,提出了一种基于N-最短路径的策略,即:在早期阶段召回N个最佳结果作为候选集,目的是覆盖尽可能多的歧义字段,最终的结果会在未登录词识别和词性标注之后,从N个最有潜力的候选结果中选优得到.不同层面的实验表明,层叠隐马模型的各个层面对汉语词法分析都发挥了积极的作用.实现了基于层叠隐马模型的汉语词法分析系统ICTCLAS.该系统在2002年的“九七三”专家组评测中获得第1名,在2003年汉语特别兴趣研究组(ACL Special Interest Groupon Chinese Language Processing,SIGHAN)组织的第1届国际汉语分词大赛中综合得分获得两项第1名、一项第2名.这表明:ICTCLAS是目前最好的汉语词法分析系统之一,层叠隐马模型能够解决好汉语词法问题.  相似文献
2.
基于特征选择的轻量级入侵检测系统   总被引:17,自引:1,他引:16       下载免费PDF全文
陈友  程学旗  李洋  戴磊 《软件学报》2007,18(7):1639-1651
基于特征选择的入侵检测系统处理的数据含有大量的冗余与噪音特征,使得系统耗用的计算资源很大,导致系统训练时间长、实时性差,检测效果不好.特征选择算法能够很好地消除冗余和噪音特征,为了提高入侵检测系统的检测速度和效果,对基于特征选择的入侵检测系统进行研究是必要的.综述了这一领域的研究进展,从过滤器、封装器、混合器3种模式对基于特征选择的轻量级入侵检测系统进行分类比较,分析和总结各种系统的优缺点以及它们各自适用的条件,最后指出入侵检测领域特征选择的发展趋势.特征选择不仅可以提升入侵检测系统的性能,而且使得对入侵检测的研究向特征提取算法的方向转移.  相似文献
3.
一种改进的Wu-Manber多关键词匹配算法   总被引:15,自引:0,他引:15  
文章提出了一种改进的Wu—Manber多关键词匹配算法。Wu—Manber算法是在Boyer-Moore单关键词匹配算法基础上派生的多关键词匹配算法。文中对这两种算法进行了比较分析,提出了对Wu—Manber算法的两点改进方法:精确的不良字符转移和弱化良好后缀转移。对原始的Wu-Manber算法和改进的算法进行对比实验,改进算法在处理大规模数据时比Wu-Manber算法的所用时间减少了8~15%。  相似文献
4.
元搜索引擎及其实现   总被引:13,自引:0,他引:13  
单个搜索引擎的索引和处理能力的提高赶不上Web数据的快速增长,结果是任何单个搜索引擎只能索引Web的一部分文档,用户需要的文档分布在许多搜索引擎的文档数据库中,元搜索引擎是架构在许多搜索引擎之上的搜索引擎,它利用各个成员搜索引擎提供的服务,能够高效方便地找到这些文档,然后合并成员搜索引擎返回的结果呈现给用户,实现了一个元搜索引擎系统,并给出建立一个高效的元搜索引擎的关键技术和经验。  相似文献
5.
基于XML的数据库信息交换机制   总被引:8,自引:0,他引:8  
该文对XML在数据库信息交换领域的应用问题进行了探讨;分析了XML在与DOM技术相结合进行数据库信息交换的优势和意义,并通过一个应用实例阐述了此种技术的具体实现方法。  相似文献
6.
基于对等网络的全文信息检索   总被引:7,自引:0,他引:7  
基于P2P方式的信息检索系统相对集中式信息检索系统具有成本低、可扩展性好、容错性强等优点,可充分挖掘网络边缘资源,并可提供个性化的信息服务.然而如何在纯P2P环境下实现全文检索并定位目标资源是困难的.当前,采用广播查询的非结构化P2P(如Gnutella)和采用分布式Hash表方式的结构化P2P(如CAN)都不能直接实现全文检索.针对这个问题,提出了基于质心法的结构化P2P全文检索方法,并建立模拟程序,对检索的性能与效果做了初步的验证.实验结果表明了该方法的有效性.  相似文献
7.
文本的图表示初探   总被引:7,自引:1,他引:6  
文本表示是文本信息处理中的基础问题,以向量空间模型(VSM)为代表的多数文本表示模型没有考虑文本中特征项之间的序关系,这样的表示造成文本语义信息的损失.我们尝试在文本表示中引入序关系,用图结构来表示文本,提出了一种新的文本表示模型-图表示模型,并对该模型的表示效果进行了验证.实验结果表明目前我们的表示模型仍达不到VSM模型所取得的表示效果.本文总结了文本表示过程,提出了一种新颖的用于度量文本表示模型表示能力的方法,同时也提出了一系列与文本图表示相关的值得探讨的问题.  相似文献
8.
语言信息处理技术中的最大熵模型方法   总被引:6,自引:0,他引:6       下载免费PDF全文
1 引言进行汉语处理时经常遇到的问题有:分词、词性标注、语法和语义分析等等。这些自然语言中的问题都可以形式化为分类问题,估计某一类y在上下文x中发生的概率,即p(y,x)。在汉语中上下文x的内容可以包括汉字、词、词性等,对于不同的任务上下文的内容也不同。这类问题可以采用统计建模的方法去处理。首先是采集大量样本进行训练,样本代表了该任务的知识和信息,选取样本的好坏确定了知识完整性的程度。然后建立一个统计模型,并把样本知识结合到模型中,来预测随机过程将来的行为。  相似文献
9.
一种全自动生成网页信息抽取Wrapper的方法   总被引:6,自引:2,他引:4  
Web网页信息抽取是近年来广泛关注的话题。如何最快最准地从大量Web网页中获取主要数据成为该领域的一个研究重点。文章中提出了一种全自动化生成网页信息抽取Wrapper的方法。该方法充分利用网页设计模版的结构化、层次化特点,运用网页链接分类算法和网页结构分离算法,抽取出网页中各个信息单元,并输出相应Wrapper。利用Wrapper能够对同类网页自动地进行信息抽取。实验结果表明,该方法同时实现了对网页中严格的结构化信息和松散的结构化信息的自动化抽取,抽取结果达到非常高的准确率。  相似文献
10.
大数据系统和分析技术综述   总被引:6,自引:0,他引:6       下载免费PDF全文
首先根据处理形式的不同,介绍了不同形式数据的特征和各自的典型应用场景以及相应的代表性处理系统,总结了大数据处理系统的三大发展趋势;随后,对系统支撑下的大数据分析技术和应用(包括深度学习、知识计算、社会计算与可视化等)进行了简要综述,总结了各种技术在大数据分析理解过程中的关键作用;最后梳理了大数据处理和分析面临的数据复杂性、计算复杂性和系统复杂性挑战,并逐一提出了可能的应对之策.  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号