排序方式: 共有97条查询结果,搜索用时 15 毫秒
1.
2.
文本分类是自然语言处理的基础任务,文本中的特征稀疏性和提取特征所用的神经网络影响后续的分类效果。针对文本中的特征信息不足以及传统模型上下文依赖关系方面不足的问题,提出经过TF-IDF加权的词向量和LDA主题模型相融合,利用双向门控循环神经网络层(BiGRU)充分提取文本深度信息特征的分类方法。该方法主要使用的数据集是天池比赛新闻文本分类数据集,首先用Word2vec和LDA模型分别在语料库中训练词向量,Word2vec经过TF-IDF进行加权所得的词向量再与LDA训练的经过最大主题概率扩展的词向量进行简单拼接,拼接后得到文本矩阵,将文本矩阵输入到BiGRU神经网络中,分别从前后两个反方向提取文本深层次信息的特征向量,最后使用softmax函数进行多分类,根据输出的概率判断所属的类别。与现有的常用文本分类模型相比,准确率、F1值等评价指标都有了较高的提升。 相似文献
3.
方面级别情感分类旨在分析一个句子中不同方面词的情感极性。先前的研究在文本表示上,难以产生依赖于特定方面词的上下文表示;在语义特征分析上,忽略了方面词的双侧文本在整体语义上与方面词情感极性之间具备不同关联度这一特征。针对上述问题,该文设计了一种双通道交互架构,同时提出了语义差这一概念,并据此构建了双通道语义差网络。双通道语义差网络利用双通道架构捕捉相同文本中不同方面词的上下文特征信息,并通过语义提取网络对双通道中的文本进行语义特征提取,最后利用语义差注意力增强模型对重点信息的关注。该文在SemEval2014的Laptop和Restaurant数据集以及ACL的Twitter数据集上进行了实验,分类准确率分别达到了81.35%、86.34%和78.18%,整体性能超过了所对比的基线模型。 相似文献
5.
一种集群计算系统中并行I/O文件存储分配策略 总被引:2,自引:0,他引:2
现代计算机系统性能已经由受限于CPU转变为受限于I/O,近年来研究人员对高性能计算中的并行I/O问题进行了深入研究.本论文的主要工作是对集群计算中的并行I/O子系统进行研究,提出一种文件拆分与存储分配的新策略,即:已知知识的文件拆分与分配方法(KKFDA),该方法保证文件存储方式与访问方式的一致性,达到了提高文件访问时的本地命中率、缩短访盘响应时间的目的.算法设计与实验证明了方法的有效性. 相似文献
6.
7.
基于Linux的SMP机群环境中并行I/O模型研究 总被引:1,自引:0,他引:1
提出了一个基于数据通路的波浪推进式并行I/O模型框架,并在基于Linux的SMP机群系统中,根据波浪推进式并行I/O模型框架对各个数据通路进行建模,具体分析了这个波浪推进式并行I/O模型,从思路上解决了刻画并行I/O性能的并行I/O模型问题。 相似文献
8.
9.
提出了一种新的应用于集群计算环境的文件分配算法,即启发式文件分类分配算法(Heuristic FileSorted Assignment algorithm,HFSA),它在保证系统负载基本均衡的前提下,按相似的访问服务时间对每个待分配的数据文件进行磁盘分配.具体实现时,首先对待分配文件按它们的服务时间大小进行排序,然后从集群中选择一个结点的磁盘,将有序的若干文件连续地分配到该磁盘上,直接该磁盘达到最大负载时为止.通过对新策略与已有的贪婪文件分配法进行实验比较,结果表明:在访问响应时间方面,系统轻负载时,缩短了20.2%,系统重负载时,缩短了31.6%,并且数据访问的速率越高,由启发式文件分类分配策略所改善的性能就越明显. 相似文献
10.
对TCP流量自相似的原因进行了分析。用ON/OFF模型解释了TCP拥塞控制机制导致自相似现象的原因,并在NS2仿真实验的基础上比较了自相似性与丢包率、负载强度的关系。仿真结果表明丢包率大小对TCP流自相似程度有着直接影响。 相似文献