首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 828 毫秒

1.  基于机器学习的文本分类技术的研究  被引次数:1
   何国辉  吴礼发《计算机与现代化》,2009年第8期
   基于机器学习的文本分类是近年来信息检索领域的热门研究技术,并且取得了较大进展.本文对文本分类的定义、文本表示进行了详细的阐述,介绍了SVM等一系列机器学习的文本分类方法和文本分类效果评估手段,指出了进一步的研究方向.    

2.  基于随机森林的文本分类研究  
   陈海利  孙志伟  庞龙《科技创新与应用》,2014年第2期
   文本分类是处理和组织大量文本数据的关键技术,它一直是信息检索领域中的一个研究热点。文本分类旨在将大量文本划分到若干子类,使得各文本子类代表不同的概念主题。文章采用了一种基于随机森林的文本分类方法。该方法来源于基于决策树的机器学习,依据文本内容的分词结果进行机器学习,将文本中信息量高的词汇提取出来作为学习维度,可以准确地对文本进行分类。由于随机森林算法Ⅲ具有高并发,快速收敛的优点,非常适合海量数据的处理。    

3.  迁移学习研究进展  被引次数:10
   庄福振  罗平  何清  史忠植《软件学报》,2015年第26卷第1期
   近年来,迁移学习已经引起了广泛的关注和研究.迁移学习是运用已存有的知识对不同但相关领域问题进行求解的一种新的机器学习方法.它放宽了传统机器学习中的两个基本假设:(1)用于学习的训练样本与新的测试样本满足独立同分布的条件;(2)必须有足够可利用的训练样本才能学习得到一个好的分类模型.目的是迁移已有的知识来解决目标领域中仅有少量有标签样本数据甚至没有的学习问题.对迁移学习算法的研究以及相关理论研究的进展进行了综述,并介绍了在该领域所做的研究工作,特别是利用生成模型在概念层面建立迁移学习模型.最后介绍了迁移学习在文本分类、协同过滤等方面的应用工作,并指出了迁移学习下一步可能的研究方向.    

4.  文本分类技术在海洋信息处理领域中的应用  
   徐大伟  董渊  张素琴《计算机科学》,2008年第35卷第11期
   文本分类是数据挖掘和机器学习中非常重要的研究领域,将文本分类技术应用于海洋信息处理已经成为海洋领域研究的一个重要问题。主要研究文本分类技术在海洋信息处理领域的应用,给出了文本分类系统的关键技术设计方案,详细介绍了一种改进的χ^2特征提取算法以及朴素贝叶斯分类算法,实验结果具有较好的准确率和查全率,满足我国“数字海洋”信息基础建设对信息处理应用的需求。    

5.  高光谱图像分类的研究进展  
   闫敬文  陈宏达  刘蕾《光学精密工程》,2019年第27卷第3期
   高光谱图像分类是利用高光谱数据图谱合一且光谱信息丰富的特点,对图像中的每个像素进行分门别类,以达到对地物目标进行高精度分类和自动化识别的目的,是对地观测的重要组成部分。在分析高光谱图像特点的基础上,本文从普通机器学习和深度学习这两方面对高光谱图像像素级分类的研究进展及效果进行总结、评述和比较,通过具体实验的结果对比,直观地展现各种算法的优劣。针对高光谱分类问题,本文从两个方面对今后的研究方向及发展前景进行了分析和展望。一方面,在算法研究上,高光谱图像分类算法可在保证分类精度的前提下降低算法的复杂度,利用多源遥感数据、多特征综合、多尺度复合,提升小样本、少参数分类模型的分类精度,适应智能化、快速化高光谱遥感对地观测的发展要求;另一方面要紧密结合市场应用需求,重视高光谱图像在实际中的应用,研究具有市场竞争力的高效分类算法,提升高光谱图像分类在遥感技术应用领域的竞争力。    

6.  文本分类综述  被引次数:1
   靳小波《自动化博览》,2006年第23卷第Z1期
   1文本分类的背景和意义上世纪九十年代以来,因特网以惊人的速度发展起来,它容纳了海量的各种类型的数据和信息,包括文本、声音、图像等。文本数据与声音和图像数据相比,占用网络资源少,更容易上传和下载,这使得网络资源中的大部分是以文本(超文本)形式出现的。如何从这些浩瀚的文本中发现有价值的信息是信息处理的一大目标。基于机器学习的文本分类系统能够在给定的分类模型下,根据文本的内容自动对文本分门别类,从而更好地帮助人们组织文本、挖掘文本信息,因此得到日益广泛的关注,成为信息处理领域最重要的研究方向之一。2文本分类的研究历…    

7.  文本挖掘研究进展  被引次数:2
   谌志群  张国煊《模式识别与人工智能》,2005年第18卷第1期
   文本挖掘又称为文本数据挖掘或文本知识发现,是指在大规模文本集合中发现隐含的、以前未知的、潜在有用的模式的过程.本文首先介绍了文本挖掘的概念,包括文本挖掘的定义、特点、与其它几个研究领域(数据挖掘、信息检索、信息抽取、计算语言学等)的关系;然后讨论了文本挖掘模型、文本特征抽取与中间表示、文本挖掘的分类与实现技术;最后介绍了几个文本挖掘产品.    

8.  基于机器学习的维吾尔文文本分类研究  被引次数:1
   阿力木江·艾沙  吐尔根·依布拉音  艾山·吾买尔  马尔哈巴·艾力《计算机工程与应用》,2012年第48卷第5期
   随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型(VSM)表示下的高维性,采用词干提取和IG相结合的方法对表示空间进行降维。采用基于机器学习的分类算法(kNN和Nave Bayes)对维吾尔文文本语料进行了分类实验并分析了实验结果。    

9.  基于机器学习的网络流量分类研究进展  
   王涛  余顺争《小型微型计算机系统》,2012年第33卷第5期
   机器学习方法不依赖匹配协议端口或解析协议内容,而是利用网络流的各种统计特征识别网络应用,近年来得到了广泛关注和快速发展.本文总结了基于机器学习的网络流量分类方法自2004年来的研究进展,并且按有监督、无监督与半监督的区别进行分类、分析与比较.重点讨论了基于机器学习的网络流量分类研究的挑战与方向,即解决样本标注瓶颈、样本分布不平衡与动态变化、实时与连续分类以及分类算法可扩展性等核心问题.    

10.  文本挖掘技术研究进展*  被引次数:20
   袁军鹏  朱东华  李毅  李连宏  黄进《计算机应用研究》,2006年第23卷第2期
   文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。首先给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展。最后指出了文本挖掘在知识发现中的重要意义,展望了文本挖掘在信息技术中的发展前景。    

11.  基于人工智能技术的大数据分析方法研究进展  
   王万良  张兆娟  高楠  赵燕伟《计算机集成制造系统》,2019年第3期
   人工智能、大数据、云计算、物联网等信息技术为推动集成制造快速发展提供了关键技术手段。近年来,采用人工智能技术进行大数据分析取得了突破性进展。系统总结了基于人工智能技术的大数据分析方法的最新研究进展。从大数据的聚类、关联分析、分类和预测4个主要的数据挖掘任务出发,分析了大数据环境下机器学习的研究现状;针对深度学习这一热点,总结了基于MapReduce、Spark的分布式深度学习实现,以及面向大数据分析的深度学习算法改进相关研究;从群智能、进化算法两方面梳理了基于计算智能的大数据分析相关研究;针对大数据平台,特别对大数据分析和深度学习集成框架进行了归纳,介绍了大数据机器学习系统和算法库;分析了大数据分析中人工智能技术面临的主要挑战,并提出了进一步的研究方向。    

12.  文本自动分类技术和算法研究综述  
   吕琳  刘玉树《计算机科学》,2004年第31卷第Z1期
   文本自动分类技术是面向Internet搜索引擎的重要研究方向和关键技术.它是指在给定的分类体系下,根据文本的内容自动确定文本关联类别的过程.本文总结和跟踪了各种常用和最新的文本分类的技术、算法及其适用范围,对评价与比较分类器性能的定理和方法进行了分析,并简述了独立于算法的机器学习.    

13.  基于向量空模型的文本自动分类系统的研究与实现  被引次数:150
   庞剑锋  卜东波  白?《计算机应用研究》,2001年第18卷第9期
   随着网络信息的迅猛发展,信息处理已经成为人工获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程。对文本分类中所涉及的关键技术,包括向量空间模型、特征提取、机器学习方法等进行了研究和探讨,并且提出了基于向量空间模型的文本分类系统的结构,并给出了评估方法和实验结果。    

14.  统计学理论在邮件分类中的应用研究  
   TANG Wei  CHENG Jia-xing  JI Xia《微机发展》,2008年第12期
   分类问题,尤其是文本自动分类一直是机器学习与数据挖掘研究中的研究热点与核心技术,其中如朴素贝叶斯、KNN等近年来得到了广泛的关注和快速的发展。文中在统计学理论的基础上给出了一种基于支持向量机方法的文本分类算法,并设计出了相应的垃圾邮件过滤系统。实验证明与朴素贝叶斯方法相比,该算法极大地提高了分类准确率和查全率,具有应用推广的价值。    

15.  统计学理论在邮件分类中的应用研究  
   汤伟  程家兴  纪霞《计算机技术与发展》,2008年第18卷第12期
   分类问题,尤其是文本自动分类一直是机器学习与数据挖掘研究中的研究热点与核心技术,其中如朴素贝叶斯、KNN等近年来得到了广泛的关注和快速的发展.文中在统计学理论的基础上给出了一种基于支持向量机方法的文本分类算法,并设计出了相应的垃圾邮件过滤系统.实验证明与朴素贝叶斯方法相比,该算法极大地提高了分类准确率和查全率,具有应用推广的价值.    

16.  跨领域文本情感分类研究进展  
   赵传君  王素格  李德玉《软件学报》,2020年第31卷第6期
   作为社会媒体文本情感分析的重要研究课题之一,跨领域文本情感分类旨在利用源领域资源或模型迁移地服务于目标领域的文本情感分类任务,其可以有效缓解目标领域中带标签数据不足问题.本文从三个角度对跨领域文本情感分类方法行了归纳总结:(1)按照目标领域中是否有带标签数据,可分为直推式和归纳式情感迁移方法;(2)按照不同情感适应性策略,可分为实例迁移方法、特征迁移方法、模型迁移方法、基于词典的方法、联合情感主题方法以及图模型方法等;(3)按照可用源领域个数,可分为单源和多源跨领域文本情感分类方法.此外,论文还介绍了深度迁移学习方法及其在跨领域文本情感分类的最新应用成果.最后,论文围绕跨领域文本情感分类面临的关键技术问题,对可能的突破方向进行了展望.    

17.  自动图像标注技术研究进展  被引次数:1
   鲍 泓  徐光美  冯松鹤  须 德《计算机科学》,2011年第38卷第7期
   近年来,自动图像标注(Automatic Image Annotation,AIA)技术已经成为图像语义理解研究领域的热点。其基本思想是利用已标注图像集或其他可获得的信息自动学习语义概念空间与视觉特征空间的潜在关联或者映射关系,来预测未知图像的标注。随着机器学习理论的不断发展,包括相关模型、分类器模型等不同的学习模型已经被广泛地应用于自动图像标注研究领域。现有的自动图像标注算法可以大致分为基于分类的标注算法、基于概率关联模型的标注算法以及基于图学习的标注算法等三大类。首先根据自动图像标注算法的特征提取及表示机制不同,将现有算法划分为基于全局特征和基于区域划分的自动图像标注方法。其次,在基于区域划分的自动图像标注算法中,按照学习算法的不同,将其划分为基于分类的标注方法、基于概率关联模型的标注方法以及基于图学习的标注方法,并分别介绍各类别中具有代表性的标注算法及其优缺点。然后给出了自动图像标注最新的研究进展,最后探讨自动图像标注的进一步研究方向。    

18.  统计关系学习研究进展  被引次数:4
   刘大有  于鹏  高滢  齐红  孙舒杨《计算机研究与发展》,2008年第45卷第12期
   统计关系学习是人工智能领域的一个新研究热点,它将关系表示、似然性理论和机器学习相结合,能更好地解决现实世界中复杂的关系数据问题,在生物信息学、web导航、社会网、地理信息系统和自然语言理解等领域有着重要的应用.首先对统计关系学习的研究内容以及研究任务进行了介绍和总结,然后根据概率表示和推理机制的不同,对当前的统计关系学习方法进行了分类,并对各类方法进行了详细介绍,最后讨论了当前统计关系学习存在的问题,并指出了今后研究和发展的方向.    

19.  面向LDA主题模型的文本分类研究进展与趋势  
   赵乐  张兴旺《计算机系统应用》,2018年第27卷第8期
   文本分类是自然语言处理领域的一个重要研究方向.综合分析发现,文本分类的研究和分析,有助于对信息进行有效的分类和管理,并为自然语言处理的应用提供有力的支持.然而,已有的研究在理论和方法层面虽然已经取得了一定的成就,但是文本分类研究涉及内容、领域和技术等多个方面,各学科研究错综复杂,因此还有很多缺陷和不足,需要进一步进行系统和深入的研究.本文针对文本分类这一研究内容,探讨了文本分类和LDA主题模型的相关理论;然后,从技术、方法和应用三个方面分析了面向LDA主题模型的文本分类的研究现状,总结了目前研究中存在的一些问题和研究策略;最后,归纳出文本分类未来的一些发展趋势.    

20.  玻尔兹曼机研究进展  被引次数:1
   刘建伟  刘媛  罗雄麟《计算机研究与发展》,2014年第1期
   深度学习是机器学习中的新兴研究领域,能够很好地用于解决目标识别、语言理解等复杂问题.玻尔兹曼机作为深度学习的典型代表近年来受到了广泛研究.鉴于玻尔兹曼机的理论意义和实际应用价值,系统综述了玻尔兹曼机的研究进展,首先概述了玻尔兹曼机的相关概念,包括单层反馈网络的结构和拓扑结构分类,然后详细描述了玻尔兹曼机的学习过程和几种典型学习算法,接着对近几年玻尔兹曼机研究的新进展进行了阐述,最后提出了玻尔兹曼机中有待进一步研究解决的问题.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号