共查询到18条相似文献,搜索用时 187 毫秒
1.
游福成 《北京印刷学院学报》2009,17(2):52-54,58
在传统的从训练到分类的两级结构的基础上,提出了一种带有反馈感知机制的、具有三级结构的Web文档分类算法。同时结合现代远程教育背景,实现了Web文本挖掘的分类原型系统。在系统上对各类远程教育站点上收集的文本资料信息自动进行分类挖掘,取得了较好的实验效果。 相似文献
2.
传统胶囊网络(CapsNet)在计算时使用的动态路由算法需要多次迭代,针对这一问题,文章提出一种基于谱聚类的胶囊网络模型(Spectral Clustering Capsule Network,SC-Caps)并将其应用于文本分类任务.这种模型首先使用卷积层对文本进行特征提取,在初级胶囊层将提取的标量特征转化为向量特征,再利用谱聚类算法将高维的向量特征转化为较低维的子向量特征,并在卷积胶囊层学习局部与全局之间的关系映射.在搜狗语料库SougoCA进行实验,结果与LSTM、C-LSTM以及采用其他路由方法的胶囊网络进行比较,证明该算法有效提高了文本分类的分类效果. 相似文献
3.
4.
为了解决胶囊网络文本分类时不能有效反应不同词的重要程度问题,采用GRU提取上下文特征结合注意力机制学习不同词的重要性进行权重分配,使用胶囊网络克服卷积神经网络池化操作丢失信息的弊端,在今日头条新闻数据集上的实验结果证明文章模型的有效性。 相似文献
5.
针对短文本分类关键词特征稀疏和样本数量多,难以处理的技术难点,提出一种基于语义的KNN短文本分类算法.该算法采用基于字的分词策略提取出短文本的特征词,结合中国知网对关键词进行概念映射以提高短文本的语义表达,并针对短文本特点,通过使用LSA降维处理,对KNN分类算法加以改进.实验结果表明,该算法能够有效提高短文本的分类性能. 相似文献
6.
7.
8.
9.
10.
11.
在印前制作领域中,排版软件Adobe InDesign被誉为“排版天才”,而北大方正的飞腾大量应用于报社和出版社,受到了很多好评。这两款排版软件都以其强大的功能占据了广泛的市场。排版软件最主要的功能是处理好文字、图形、图像在版面中的关系,而文字处理又是排版中最关键的部分。笔者在此对InDesign和飞腾软件在文字处理中经常使用的一些功能作如下比较,供读者参考。1.段首缩进中文的排版规则一般为段首空两个字符,在实际排版中用定义排版格式的方法来解决这一问题。我们可以在排版格式的设置中确定段首缩进量,一旦段首缩进距离被强制定义后,… 相似文献
12.
在印前制作领域中,排版软件Adobe InDesign被誉为“排版天才”,而北大方正的飞腾大量应用于报社和出版社,受到了很多好评。这两款排版软件都以其强大的功能占据了广泛的市场。 相似文献
13.
14.
为了解决TextRank算法的初始权值问题,提高关键词的抽取质量,在TextRank算法的基础上,引入了G1赋权法对TF-IDF算法的词语位置、词语长度和词性等3个属性赋予不同的权重,设计并实现了综合权重法的关键词抽取算法——TextRank-CM算法。将TextRank-CM算法、TextRank+TF-IDF算法和TextRank算法分别应用于中文关键词的抽取,结果表明:TextRank-CM算法在中文关键词抽取中的准确率和召回率明显优于另两种算法。 相似文献
15.
为了有效地保护各种数字化产品的版权,防止产品被篡改、假冒和盗用,作为一种新的数字产品版权保护技术,数字水印应运而生。目前,数字水印技术的研究内容主要有图像、视频、音频和文本等,分析了当前几种常用的文本数字水印技术,设计并实现了一种基于XML的文本数字水印系统,即利用XML的标记节点和文本内容中逗号的替换完成数字水印的嵌入。通过对一篇实际文章的测试,分析并证明了该算法的可行性。 相似文献
16.
17.
霉变是导致粮食储藏过程中数量减少、质量降低的重要因素,若能早期预测粮食是否会发生霉变,提前采取处置措施,对保障粮食储藏安全,降低粮食损失具有重要的意义。本文采用支持向量机算法,并通过网格搜索优化参数,分别建立了稻谷和小麦霉变的预测分类模型,以判定在给定水分、温度和储藏时间的条件下是否会发生霉变。实验结果表示,稻谷平均准确率可达96%以上,小麦平均准确率可达92%以上。同时本研究采取不同规模的小样本训练建模,并与BP神经网络模型进行对比,训练结果表明,基于SVM的模型准确率高且表现稳定,明显优于BP神经网络模型。 相似文献
18.
严志永 《北京印刷学院学报》2021,29(3):72-75
本文从文本情感角度来研究《红楼梦》作者问题.人工智能中的情感分析技术能够预测指定文本属于积极类别和消极类别的概率.本文将《红楼梦》的每一回划分成若干句子,使用百度飞桨提供的情感分析服务来预测每个句子的情感,将句子情感的平均值作为每回的情感.从情感波动范围、情感波动模式和情感均值三个方面对前80回和后40回进行分析,结果表明前80回和后40回有较大差异,这表明《红楼梦》不是一个作者所写. 相似文献