期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

胡玉娴《中国电子商情》2009,(3)

特征选择是文本聚类的重要环节,传统的阈值截断特征选择方法偏重高权重项,受特征词权重计算公式影响较大.遗传算法具有全局搜索的能力,并允许权重低的特征项以一定概率参与遗传进化.另外,本文提出基于<知网>特征词合并算法,通过合并具有高度相似性的特征词,实现初步降维.实验结果表明,基于<知网>和遗传算法的中文文本聚类特征选择方法能够有效降低特征向量维度,并且聚类结果较为稳定. 相似文献

2.

基于《知网》和遗传算法的中文文本聚类特征选择

胡玉娴《中国电子商情》2009,(2)

特征选择是文本聚类的重要环节,传统的阈值截断特征选择方法偏重高权重项,受特征词权重计算公式影响较大。遗传算法具有全局搜索的能力,并允许权重低的特征项以一定概率参与遗传进化。另外,本文提出基于《知网》特征词合并算法,通过合并具有高度相似性的特征词,实现初步降维。实验结果表明,基于《知网》和遗传算法的中文文本聚类特征选择方法能够有效降低特征向量维度,并且聚类结果较为稳定。相似文献

3.

基于模糊聚类的文本分类器

周永健郑玉明廖湖声《微电子学与计算机》2006,23(Z1):137-140

文章提出了一种基于模糊聚类的文本分类器构造方法,介绍了文本中特征词之间模糊相似度的度量方法,给出了利用“编网法”思想实现模糊聚类的算法。通过比较文本中特征词之间的模糊相似度,实现特征词的聚类,最终获取能够识别文本主题类别的特征词集合,并给出了分类器性能的测试结果。相似文献

4.

基于独立分量分析的文本特征提取算法

孔峰王丽君吴俊华《电子技术》2012,39(2):48-50

文本特征提取的正确高效直接影响聚类结果准确率,针对文本特征提取中文本数据的高维、高噪声问题,提出采用独立分量分析作为文本特征词的提取技术.采用TF-IDF方法形成文本特征的数字描述矩阵一向量空间模型,使用独立分量分析算法实现对矩阵的关键特征词提取,使用非负矩阵分解及其扩展算法对矩阵进行聚类分析,实现聚类. 相似文献

5.

使用谱聚类算法解决文本聚类集成问题 总被引：1，自引：0，他引：1

徐森卢志茂顾国昌《通信学报》2010,31(6):58-66

采用2个不同的谱聚类算法解决文本聚类集成问题.为使算法可扩展到大规模应用,基于代数变换,通过求解小规模矩阵的特征值分解问题避免了大规模矩阵的特征值分解问题,有效降低了2个谱聚类算法的计算复杂度.分别从矩阵扰动理论和图上的随机游走的角度解释了2个算法的有效性.在真实文本集上的实验结果表明:提出的代数变换方法是有效的,该方法可以有效提高谱聚类算法的运行效率;该聚类集成谱算法比其他常见的聚类集成算法更优越、更高效,可以有效解决文本聚类集成问题. 相似文献

6.

一种分布式中文微博热点话题的发现方法

张翔吝睿涛《无线互联科技》2014,(12):168-169

针对微博数据文本内容短小、特征词稀疏以及规模庞大的特点,提出了一种基于MapReduce编程模型的发现微博热点话题的方法。该方法首先利用隐主题分析技术解决了微博内容短小、特征词稀疏的问题,然后利用CURE算法缓解了Kmeans算法对初始点敏感的问题,最后采用基于MapReduce编程模型Kmeans聚类算法,对海量微博短文本数据进行快速聚类。实验结果表明该方法可以有效提高微博热点话题发现的效率。相似文献

7.

针对时间序列多步预测的聚类隐马尔科夫模型 总被引：1，自引：0，他引：1

下载免费PDF全文

章登义欧阳黜霏吴文李《电子学报》2014,42(12):2359-2364

时间序列的预测在现今社会各个领域中有着广泛的应用.本文针对时间序列趋势预测中的多步预测问题,提出了基于聚类的隐马尔科夫模型,利用隐马尔科夫模型中的隐状态来表示产生时间序列数据时的系统内部状态,实现对多步时间序列的预测.针对时间序列聚类中的距离计算问题,提出结合时间序列时间性和相似性的聚类算法,并给出了迭代精化基于聚类的隐马尔科夫模型的方法.实验表明,本文提出的方法在时间序列多步预测中精度较高. 相似文献

8.

基于MapReduce的改进k-means文本聚类算法

《信息技术》2016,(11):201-205

针对传统k-means文本聚类算法在处理大规模文本数据时扩展性不足的问题,提出了基于MapReduce编程模型的并行k-means文本聚类算法。通过删除离群点和采用高效的初始质心选择策略提高k-means聚类效果,并设计基于MapReduce框架的大规模文本并行聚类模型提高算法的可扩展性。实验证明,该算法在大规模文本聚类中具有良好的聚类效果和可扩展性。相似文献

9.

基于FCM和随机游走的地层图像分割方法 总被引：1，自引：0，他引：1

下载免费PDF全文

陈圣国孙正兴周杰《电子学报》2013,41(3):526

颜色特征是地层图像分割的重要依据,但地层图像的高噪声以及地层边界颜色混合使得颜色特征空间聚类分割方法无法获得很好的结果.本文提出了一种融合模糊C均值聚类与随机游走算法的图像分割算法,该算法在聚类过程中结合像素的空间信息计算像素的隶属度,在基于随机游走的半监督图像分割算法中像素结点构成的四连通图上插入类属结点作为已标记结点,将随机游走者第一次游走到某个类属结点的概率作为该像素隶属于该类的隶属度.实验结果表明,本算法可以对地层边界颜色混合区域的像素更准确地进行分类,噪声敏感性降低,有效解决构造模拟地层图像的分割问题. 相似文献

10.

基于马尔科夫的聚类算法仿真分析

《信息技术》2019,(5):58-60

针对传统k均值聚类算法易受初始条件影响的问题,文中在已有聚类算法的基础上提出了一个新型的图型聚类算法:马尔科夫(MCL)聚类算法。通过MATLAB仿真软件对空手道俱乐部数据用马尔科夫聚类算法进行仿真分析,得出聚类结果,并同时分析参数对算法性能的影响。实验结果表明,马尔科夫聚类算法可以应用于对图的聚类中,但同时也会受到参数的影响。相似文献

11.

Quality biased multimedia data retrieval in microblogs

《Journal of Visual Communication and Image Representation》2016

With the rapid development of social media platforms, huge amount of user generated contents (UGC) are generated ceaselessly. In recent years, content based microblog retrieval has attracted extensive research attention. Effective microblog retrieval services complex analysis of short text and multimedia contents. In this paper, we present a quality biased multimedia microblog retrieval framework. First, we develop an anchor graph based multiview embedding framework which maps the multimedia content features into a unified latent space. Then, the content matching scores of testing microblogs related to the query are obtained by a Markov random field. Further, we employ an quality model to incorporate both microblog quality and content matching. As compared with the state-of-art methods, experimental results demonstrate the effectiveness of the proposed approach. 相似文献

12.

Probabilistic error propagation model for mechatronic systems

《Mechatronics》2014,24(8):1189-1202

相似文献

13.

结合颜色和MGD特征及MRF模型的场景文本分割 总被引：1，自引：1，他引：0

刘晓佩卢朝阳李静姜维《光电子．激光》2014,(9):1824-1829

针对场景文本受到光照、复杂背景等因素影响而难以进行有效分割的问题,提出了一种融合颜色和最大梯度差(MGD,maximum gradient difference)特征及马尔科夫随机场(MRF,Markov random field)的场景文本分割方法。首先提取能够有效表达文本纹理特性的MGD特征,通过概率框架将其和颜色特征结合起来对观测图像进行建模;然后结合空间关系和邻域像素属性差异对传统势函数进行改进;最后建立场景文本分割的MRF模型,利用图割(graph cut)算法快速地求解该模型。实验结果表明,采用颜色和MGD特征相结合以及改进的势函数对分割结果具有较大地改善,尤其在光照不均匀及背景复杂情况下相比其他算法取得了较好的性能。相似文献

14.

Multi-layered attentional peephole convolutional LSTM for abstractive text summarization

Md. Motiur Rahman Fazlul Hasan Siddiqui 《ETRI Journal》2021,43(2):288-298

Abstractive text summarization is a process of making a summary of a given text by paraphrasing the facts of the text while keeping the meaning intact. The manmade summary generation process is laborious and time-consuming. We present here a summary generation model that is based on multilayered attentional peephole convolutional long short-term memory (MAPCoL; LSTM) in order to extract abstractive summaries of large text in an automated manner. We added the concept of attention in a peephole convolutional LSTM to improve the overall quality of a summary by giving weights to important parts of the source text during training. We evaluated the performance with regard to semantic coherence of our MAPCoL model over a popular dataset named CNN/Daily Mail, and found that MAPCoL outperformed other traditional LSTM-based models. We found improvements in the performance of MAPCoL in different internal settings when compared to state-of-the-art models of abstractive text summarization. 相似文献

15.

基于编辑行为码的图概要技术

下载免费PDF全文

王雄董一鸿潘剑飞陈华辉钱江波《电子学报》2000,48(12):2434-2443

相似文献

16.

面向方面情感分析的多通道增强图卷积网络

韩虎范雅婷徐学锋《电子与信息学报》2024,46(3):1022-1032

传统的基于单通道的特征提取方式,仅使用单一的依赖关系捕获特征,忽略单词间的语义相似性与依赖关系类型信息。尽管基于图卷积网络进行方面情感分析的方法已经取得一定成效,但始终难以同时聚合节点的语义信息和句法结构特征,在整个迭代训练过程中最初的语义特征会逐渐遗失,影响句子最终的情感分类效果。由于缺乏先验知识会导致模型对相关情感词的误解,因此需要引入外部知识来丰富文本信息。目前,如何利用图神经网络(GNN)融合句法和语义特征的方式仍值得深入研究。针对上述问题,该文提出一种多通道增强图卷积网络模型。首先,通过对情感知识和依赖类型增强的句法图进行图卷积操作,得到基于语法的两种表示,与经过多头注意力和图卷积学习到的语义表示进行融合,使多通道的特征能够互补学习。实验结果表明,在5个公开数据集上,准确率和宏F1值优于基准模型。由此可见,依赖类型和情感知识均对增强句法图有重要影响,表明融合语义信息与句法结构的有效性。相似文献

17.

Sentiment classification using the theory of ANNs

Jian ZHU Chen XU Han-shi WANG 《中国邮电高校学报(英文版)》2010

Sentiment classification has attracted increasing interest from natural language processing. The goal of sentiment classification is to automatically identify whether a given piece of text expresses positive or negative opinion on a topic of interest. This paper presents the standpoint that uses individual model (i-model) based on artificial neural networks (ANNs) to determine text sentiment classification. The individual model consists of sentimental features, feature weight and prior knowledge base. During the training process, i-model that makes right sentimental judgment will correct those are wrong, to make more accurate prediction of text sentiment polarity. Experimental results show that the accuracy of individual model is higher than that of support vector machines (SVMs) and hidden Markov model (HMM) classifiers on movie review corpus. 相似文献

18.

基于CNNCIFG-Attention模型的文本情感分类

李辉王一丞《电子科技》2022,35(2):46-51

神经网络在处理中文文本情感分类任务时,文本显著特征提取能力较弱,学习速率也相对缓慢.针对这一问题,文中提出一种基于注意力机制的混合网络模型.首先对文本语料进行预处理,利用传统的卷积神经网络对样本向量的局部信息进行特征提取,并将其输入耦合输入和遗忘门网络模型,用以学习前后词句之间的联系.随后,再加入注意力机制层,对深层次... 相似文献

19.

基于胶囊网络的中长微博情感分析

下载免费PDF全文

吴仁彪乔晗贾云飞刘闪亮张振驰刘洋《信号处理》2022,38(8):1632-1641

针对通过微博文本获取用户情感倾向,以提高舆情监控效率的问题。利用深度学习的方法实现微博语料的情感分类,构建符合近年文本长度分布特点的高质量微博情感分类数据集,分析微博文本长度对情感分类的影响。由于中长语料主观性强、句子关联度弱,其检测准确率偏低。针对此问题,本文提出一种基于胶囊网络的中长微博情感分析模型。采用注意力机制,在融合局部特征与全局特征的基础上,利用胶囊向量实现深层情感特征提取,提高中长语料的检测效果。利用本文搜集的数据集进行实验,结果表明,相较于多种深度学习算法,本文模型性能更佳。在不同文本长度语料的对比实验中,伴随着文本长度的增加,分类准确率逐渐降低。相较于传统的LSTM算法,本文模型随文本长度增加效果提升,证明了该模型针对中长微博文本情感分类的可行性。相似文献

20.

基于最大熵的隐马尔可夫模型文本信息抽取 总被引：29，自引：3，他引：26

下载免费PDF全文

林亚平刘云中周顺先陈治平蔡立军《电子学报》2005,33(2):236-240

文本信息抽取是处理海量文本的重要手段之一.最大熵模型提供了一种自然语言处理的方法.提出了一种基于最大熵的隐马尔可夫模型文本信息抽取算法.该算法结合最大熵模型在处理规则知识上的优势,以及隐马尔可夫模型在序列处理和统计学习上的技术基础,将每个观察文本单元所有特征的加权之和用来调整隐马尔可夫模型中的转移概率参数,实现文本信息抽取.实验结果表明,新的算法在精确度和召回率指标上比简单隐马尔可夫模型具有更好的性能. 相似文献