首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
在传统的从训练到分类的两级结构的基础上,提出了一种带有反馈感知机制的、具有三级结构的Web文档分类算法。同时结合现代远程教育背景,实现了Web文本挖掘的分类原型系统。在系统上对各类远程教育站点上收集的文本资料信息自动进行分类挖掘,取得了较好的实验效果。  相似文献   

2.
传统胶囊网络(CapsNet)在计算时使用的动态路由算法需要多次迭代,针对这一问题,文章提出一种基于谱聚类的胶囊网络模型(Spectral Clustering Capsule Network,SC-Caps)并将其应用于文本分类任务.这种模型首先使用卷积层对文本进行特征提取,在初级胶囊层将提取的标量特征转化为向量特征,再利用谱聚类算法将高维的向量特征转化为较低维的子向量特征,并在卷积胶囊层学习局部与全局之间的关系映射.在搜狗语料库SougoCA进行实验,结果与LSTM、C-LSTM以及采用其他路由方法的胶囊网络进行比较,证明该算法有效提高了文本分类的分类效果.  相似文献   

3.
为弥补传统胶囊网络在进行文本分类时无法识别文本序列中各单词的重要程度及其之间的依赖关系,该文提出一种融合BiGRU和多头注意力机制的胶囊文本分类模型——BMCapsNet模型。该模型首先使用BiGRU和多头注意力机制对文本进行全局特征获取,然后利用胶囊网络提取更深层次的语义信息并通过胶囊预测进行文本分类。将其应用于中文新闻标题文本分类任务,在THUCNews新闻标题数据集和今日头条新闻标题数据集上证明模型的有效性。  相似文献   

4.
为了解决胶囊网络文本分类时不能有效反应不同词的重要程度问题,采用GRU提取上下文特征结合注意力机制学习不同词的重要性进行权重分配,使用胶囊网络克服卷积神经网络池化操作丢失信息的弊端,在今日头条新闻数据集上的实验结果证明文章模型的有效性。  相似文献   

5.
针对短文本分类关键词特征稀疏和样本数量多,难以处理的技术难点,提出一种基于语义的KNN短文本分类算法.该算法采用基于字的分词策略提取出短文本的特征词,结合中国知网对关键词进行概念映射以提高短文本的语义表达,并针对短文本特点,通过使用LSA降维处理,对KNN分类算法加以改进.实验结果表明,该算法能够有效提高短文本的分类性能.  相似文献   

6.
随着时光的流逝,科技已经得到了快速的发展。机器学习和数据挖掘技术在不知不觉中已经发展到了相对成熟的地步,在日常生活中被广泛应用。随着互联网技术的不断完善,人们对网络的依赖程度越来越高,文本信息以各种各样的形式在网络中传递,文本的分类研究也已经涉及日常生活中的各个领域,包括平时所见的用户评论挖掘、网页分类、微博情感分析、Web文档自动分类、数字图书馆、自动文摘、单词语义辨析等有关操作。  相似文献   

7.
8.
文本分类是处理和组织大量文本数据的关键技术,它一直是信息检索领域中的一个研究热点。文本分类旨在将大量文本划分到若干子类,使得各文本子类代表不同的概念主题。文章采用了一种基于随机森林的文本分类方法。该方法来源于基于决策树的机器学习,依据文本内容的分词结果进行机器学习,将文本中信息量高的词汇提取出来作为学习维度,可以准确地对文本进行分类。由于随机森林算法Ⅲ具有高并发,快速收敛的优点,非常适合海量数据的处理。  相似文献   

9.
朴素贝叶斯算法是一种基于概率统计的分类算法,广泛应用于机器学习中分类问题的求解中。文本分类是自然语言处理和数据挖掘领域中的研究热点有着广泛的应用前景。朴素贝叶斯算法已经在文本分类中取得了较好的分类效果,但是由于文本词向量的特征向量维度高,很多分类算法的求解效率和准确率都不高。文章提出一种基于词向量间余弦相似度的改进朴素贝叶斯算法,有效的降低了特征向量的数据冗余和计算复杂性。  相似文献   

10.
本文通过对最新的国内外废纸分类标准对比,分析识别出各项标准规定的差异,并得出相较于国内废纸分类标准,国际主流废纸分类的精细化程度高、但限量相对宽松的结论。为相关方优化管理和贸易方案提供技术基础。  相似文献   

11.
在印前制作领域中,排版软件Adobe InDesign被誉为“排版天才”,而北大方正的飞腾大量应用于报社和出版社,受到了很多好评。这两款排版软件都以其强大的功能占据了广泛的市场。排版软件最主要的功能是处理好文字、图形、图像在版面中的关系,而文字处理又是排版中最关键的部分。笔者在此对InDesign和飞腾软件在文字处理中经常使用的一些功能作如下比较,供读者参考。1.段首缩进中文的排版规则一般为段首空两个字符,在实际排版中用定义排版格式的方法来解决这一问题。我们可以在排版格式的设置中确定段首缩进量,一旦段首缩进距离被强制定义后,…  相似文献   

12.
在印前制作领域中,排版软件Adobe InDesign被誉为“排版天才”,而北大方正的飞腾大量应用于报社和出版社,受到了很多好评。这两款排版软件都以其强大的功能占据了广泛的市场。  相似文献   

13.
针对目前文本挖掘的情感分析方法的准确性、实时性、提取等问题,构造一种神经网络混合模式,使用记忆神经网络和卷积神经网络对文本特性的提取,再利用情感分析方法进行挖掘。实验表明对文本挖掘的准确性提高了,这种模式在应用中有很大的实用性。  相似文献   

14.
为了解决TextRank算法的初始权值问题,提高关键词的抽取质量,在TextRank算法的基础上,引入了G1赋权法对TF-IDF算法的词语位置、词语长度和词性等3个属性赋予不同的权重,设计并实现了综合权重法的关键词抽取算法——TextRank-CM算法。将TextRank-CM算法、TextRank+TF-IDF算法和TextRank算法分别应用于中文关键词的抽取,结果表明:TextRank-CM算法在中文关键词抽取中的准确率和召回率明显优于另两种算法。  相似文献   

15.
为了有效地保护各种数字化产品的版权,防止产品被篡改、假冒和盗用,作为一种新的数字产品版权保护技术,数字水印应运而生。目前,数字水印技术的研究内容主要有图像、视频、音频和文本等,分析了当前几种常用的文本数字水印技术,设计并实现了一种基于XML的文本数字水印系统,即利用XML的标记节点和文本内容中逗号的替换完成数字水印的嵌入。通过对一篇实际文章的测试,分析并证明了该算法的可行性。  相似文献   

16.
观察和分析了白酒显微形态结构,提出一种基于微观形态的白酒鉴定方法.以白酒显微形态图像信息为桥梁,将白酒内在的、微观的变化规律和特点同白酒宏观的酒质级别关联起来,利用白酒显微形态信息从微观上把握白酒的分级.提出白酒鉴别系统方案,构建出具体学习子系统、应用子系统和质量控制子系统框架结构,并进行应用展望.  相似文献   

17.
霉变是导致粮食储藏过程中数量减少、质量降低的重要因素,若能早期预测粮食是否会发生霉变,提前采取处置措施,对保障粮食储藏安全,降低粮食损失具有重要的意义。本文采用支持向量机算法,并通过网格搜索优化参数,分别建立了稻谷和小麦霉变的预测分类模型,以判定在给定水分、温度和储藏时间的条件下是否会发生霉变。实验结果表示,稻谷平均准确率可达96%以上,小麦平均准确率可达92%以上。同时本研究采取不同规模的小样本训练建模,并与BP神经网络模型进行对比,训练结果表明,基于SVM的模型准确率高且表现稳定,明显优于BP神经网络模型。  相似文献   

18.
本文从文本情感角度来研究《红楼梦》作者问题.人工智能中的情感分析技术能够预测指定文本属于积极类别和消极类别的概率.本文将《红楼梦》的每一回划分成若干句子,使用百度飞桨提供的情感分析服务来预测每个句子的情感,将句子情感的平均值作为每回的情感.从情感波动范围、情感波动模式和情感均值三个方面对前80回和后40回进行分析,结果表明前80回和后40回有较大差异,这表明《红楼梦》不是一个作者所写.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号