首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
隐马尔可夫模型是对DNA序列建模的一种简单且有效的模型, 实际应用中通常采用一阶隐马尔可夫模型. 然而, 由于其一阶无后效性的特点, 一阶隐马尔科夫模型无法表示非相邻碱基间的依赖关系, 从而导致序列中一些有用统计特征的丢失. 本文在分析DNA序列特有的生物学构造的基础上, 提出一种用于DNA序列分类的二阶隐马尔可夫模型, 该模型继承了一阶隐马尔可夫模型的优点, 充分表达了蕴涵在DNA序列中的生物学统计特征, 使得新模型具有明确的生物学意义. 基于新模型, 提出一种DNA序列的贝叶斯分类新方法, 并在实际DNA序列上进行了实验验证. 实验结果表明, 由于二阶隐马尔可夫模型充分反映了DNA序列碱基间的结构信息, 新方法有效地提高了序列的分类精度.  相似文献   

2.
为增加向量空间模型的文本语义信息,提出三元组依存关系特征构建方法,将此方法用于文本情感分类任务中。三元组依存关系特征构建方法在得到完整依存解析树的基础上,先依据中文语法特点,制定相应规则对原有完整树进行冗余结点的合并和删除;再将保留的依存树转化为三元组关系并一般化后作为向量空间模型特征项。为了验证此种特征表示方法的有效性,构造出在一元词基础上添加句法特征、简单依存关系特征和词典得分不同组合下的特征向量空间。将三元组依存关系特征向量与构造出的不同组合特征向量分别用于支持向量机和深度信念网络中。结果表明,三元组依存关系文本表示方法在分类精度上均高于其他特征组合表示方法,进一步说明三元组依存关系特征能更充分表达文本语义信息。  相似文献   

3.
基于序列模式特征和SVM的剪切位点预测   总被引:1,自引:1,他引:0       下载免费PDF全文
通过对HS3D数据集供点序列碱基的统计分析,利用供体位点邻域碱基出现规律构造模式(motif)作为DNA序列的属性。设置序列属性值将字符序列映射成数字向量,应用支撑向量机进行实验,实现对供体位点的预测分类。实验结果表明,与改进的motif得分模型方法相比,该文方法可有效去除数据中异常数据对分类的影响,将DNA字符序列变换到motif属性数字序列空间具有有效性和实用性。  相似文献   

4.
郭倩  杨红菊  梁新彦 《计算机应用》2016,36(7):1918-1922
图像与图像之间没有清晰的空间结构,这样就不能有效利用图像间空间结构上的相关性信息,针对此问题提出一种基于新的空间关系特征的图像检索方法。首先,提取待查询图像在内的全部图像的特征向量。然后,计算特征向量每两个之间的相似性,形成相似性矩阵。将相似性矩阵的列集合作为新特征向量,命名为新的空间关系特征向量,从而将原来的特征向量映射到一个欧氏空间上。最后,在新特征空间上计算相似性,特征向量之间的相似性问题就转化为新的空间关系特征向量之间的相似性问题。在新特征空间上,图像与图像之间的空间结构变得清晰了,有利于图像检索准确度的提高。在Corel数据库上进行实验,所提方法在平均检索查准率、查全率-查准率和可视化评价指标上都优于基于颜色直方图的图像检索方法。结果表明,基于新的空间关系特征的图像检索方法有效利用了图像间空间结构上的相关性信息,具有更好的检索效果。  相似文献   

5.
模糊聚类分析方法在DNA序列分类中的应用   总被引:3,自引:0,他引:3  
该文采用模糊聚类分析的方法对DNA序列进行分类.首先从DNA序列中单个碱基分布的“密度”角度出发,提取出DNA序列的特征,然后用模糊聚类分析中常用的方法对DNA序列进行分类.该文运用自行研制开发的集成11种模糊聚类分析算法的模糊聚类分析运算工具,首先对已知的1-20个DNA序列进行模糊聚类分析,根据分类结果的精度,找出了较优的6种聚类分析算法,然后用余下的21-40个DNA序列进行分类;最后,本文一次对所有的1-40个DNA序列进行归类,并综合了所有的分类结果,将难以归类的DNA序列进行了归类.分析结果表明,模糊聚类分析算法具有分类简单且分类结果精度较高的优点.  相似文献   

6.
刘芸  于治楼  付强 《计算机工程》2019,45(6):230-236
跨媒体检索方法多数将2个模态的原始特征映射到公共子空间,在子空间中执行跨媒体检索,忽略了判别特征的选择以及模态间的关系。为此,提出一种基于耦合字典学习和图形正则化的新型跨模态检索方法。通过关联和联合更新不同模态的字典,为不同的模态生成均匀的稀疏表示。将不同模态的稀疏表示投影到由类标签信息定义的公共子空间中,以执行跨模态匹配,同时对投影矩阵施加21范数项,选择特征空间的相关和辨别性特征。在此基础上,利用图正则化项保留模态间和模态内相似关系。实验结果表明,与典型相关分析方法相比,该方法跨媒体检索精度较高。  相似文献   

7.
提出了一种新的以Bhattacharyya距离为准则的核空间特征提取算法.该算法的核心思想是把样本非线性映射到高维核空间.在核空间中寻找一组最优特征向量,然后把样本线性映射到低维特征空间,使类别间的Bhattacharyya距离最大。从而保证Bayes分类误差上界最小.采用核函数技术,把特征提取问题转化为一个QP(Quadratic Programming)优化问题.保证了算法的全局收敛性和快速性.此算法具有两个优点:(1)该算法提取的特征对数据分类来说更有效;(2)对于给定的模式分类问题,算法可以预测出在不损失分类精度情况下所必须的特征向量数目的上界,并能够提取出分类有效特征.实验结果表明,该算法的性能与理论分析的结论相吻合,优于目前常用的特征提取算法.  相似文献   

8.
DNA序列分类的神经网络方法   总被引:5,自引:3,他引:5  
该文将人工神经网络方法用于DNA分类,首先应用概率统计的方法对20个已知类别的人工DNA序列进行特征提取,形成DNA序列的特征向量,并将之作为样本输入BP神经网络进行学习。采用MATLAB软件包中的神经网络工具箱中的反向传播算法来训练神经网络。构造了两个三层BP神经网络,将提取的DNA特征向量集作为样本分别输入这两个网络进行学习,通过训练后,将20个未分类的人工序列样本和182个自然序列样本提取特征向量并输入两个网络进行分类,结果表明,分类方法能够以很高的正确率和精度对DNA进行分类,将人工神经网络用于DNA序列分类是完全可行的。  相似文献   

9.
社交网络信息已被广泛的应用到传统的推荐上,一定程度上减轻了数据稀疏和冷启动问题.随着表示学习的兴起,出现了利用表示学习进行推荐的算法研究.然而社交网络过大,表示学习可扩展性差,难以在有限内存中进行计算.聚集图通过空间压缩,保留了关键的结构关系,去除次要或噪音的结构数据,便于表示学习能够有效学习图结构,从而更好地找到相似用户进行推荐.首先,利用图聚集算法同时考虑分组间及分组内的结构得到最终的聚集图;其次,在聚集图上计算随机游走的转移概率,然后选择每个具有偏差概率的后继节点并生成节点序列;最后将节点序列输入到skip-gram学习用户的潜在表示,获得节点的表示向量整合其信息到贝叶斯个性化排序模型(BPR)来解决项目排名问题.实验结果表明,该方法相比于社会化贝叶斯个性化排序(SBPR)、协同用户网络嵌入(CUNE)等基线方法在推荐任务中保持时间效率的同时有效提升了准确率、召回率和平均精度均值.  相似文献   

10.
时间序列数据的特征表示方法是时间序列数据挖掘任务的关键技术,符号聚合近似表示(SAX)是特征表示方法中比较常用的一种。针对SAX算法在各序列段表示符号一致时无法区分时间序列间的相似性这一缺陷,提出了一种基于始末距离的时间序列符号聚合近似表示方法(SAX_SM)。由于时间序列有很强的形态趋势,因此文中提出的方法选用起点和终点来表示各个序列段的形态特征,并使用各序列段的形态特征和表示符号来近似表示时间序列数据,以将其从高维空间映射到低维空间;然后,针对起点和终点构建始末距离来计算两序列段间的形态距离;最后, 结合 始末距离和符号距离定义一种新的距离度量方式,以更客观地度量时间序列间的相似性。理论分析表明,该距离度量满足下界定理。在20组UCR时间序列数据集上的实验表明,所提SAX_SM方法在13个数据集中获得了最高的分类准确率(包含并列最大的),而SAX只在6个数据集中获得了最高的分类准确率(包含并列最大的),因此SAX_SM具有比SAX更优的分类效果。  相似文献   

11.
一种新型的两级指纹分类方法   总被引:2,自引:0,他引:2  
提出了一种利用隐马尔可夫模型(HMM)和支持向量机(SVM)的两级指纹分类新方法. 该方法采用指纹编码(FingerCode)作为指纹的特征表述,在对分类器进行训练之后,首先用5个 伪二维HMM对待分类指纹进行类别初选,确定最可能的两种指纹分类结果,再用相应的SVM 分类器做最终判决.最后使用NIST-4数据库中的2000幅指纹和CQU-VERIDICOM数据库的 1000幅指纹对该方法进行了实验,其分类的准确性为91%,连续性为93.7%,这证明了该方法的 有效性.  相似文献   

12.
为了利用HMM抽取的步态序列的动态特征来进行身份确认,首先提出一种改进的角度向量用来表征二值化的步态序列图像,以便将每幅图像转化为1维向量,然后再以此作为特征向量,对每个人物建立并训练HMM模型,用于确定人物身份。这种改进的角度向量由于具有较强的抗噪性和方便的尺度伸缩性能,因此既适用于分割质量较差的图像,又能减小行走方向和距离的影响。实验表明,这种HMM不仅能较好地模拟步态的动态特征,还能描述序列图像间的联系,而且算法执行速度快,从输入原始数据到输出识别结果所需时间不超过2min,能满足实时要求。在Soton和NLPR数据库上进行的实验,分别获得了100%和85%的识别率,证明该方法是有效的。  相似文献   

13.
在方面级情感分类任务中,现有方法强化方面词信息能力较弱,局部特征信息利用不充分.针对上述问题,文中提出面向方面级情感分类的特征融合学习网络.首先,将评论处理为文本、方面和文本-方面的输入序列,通过双向Transformer的表征编码器得到输入的向量表示后,使用注意力编码器进行上下文和方面词的建模,获取隐藏状态,提取语义信息.然后,基于隐藏状态特征,采用方面转换组件生成方面级特定的文本向量表示,将方面信息融入上下文表示中.最后,对于方面级特定的文本向量通过文本位置加权模块提取局部特征后,与全局特征进行融合学习,得到最终的表示特征,并进行情感分类.在英文数据集和中文评论数据集上的实验表明,文中网络提升分类效果.  相似文献   

14.
Hidden Markov models (HMM) are a widely used tool for sequence modelling. In the sequence classification case, the standard approach consists of training one HMM for each class and then using a standard Bayesian classification rule. In this paper, we introduce a novel classification scheme for sequences based on HMMs, which is obtained by extending the recently proposed similarity-based classification paradigm to HMM-based classification. In this approach, each object is described by the vector of its similarities with respect to a predetermined set of other objects, where these similarities are supported by HMMs. A central problem is the high dimensionality of resulting space, and, to deal with it, three alternatives are investigated. Synthetic and real experiments show that the similarity-based approach outperforms standard HMM classification schemes.  相似文献   

15.
In the present paper, a trajectory model, derived from a hidden Markov model (HMM) by imposing explicit relationships between static and dynamic feature vector sequences, is developed and evaluated. The derived model, named a trajectory HMM, can alleviate two limitations of the standard HMM, which are (i) piece-wise constant statistics within a state and (ii) conditional independence assumption of state output probabilities, without increasing the number of model parameters. In the present paper, a Viterbi-type training algorithm based on the maximum likelihood criterion is also derived. The performance of the trajectory HMM was evaluated both in speech recognition and synthesis. In a speaker-dependent continuous speech recognition experiment, the trajectory HMM achieved an error reduction over the corresponding standard HMM. Subjective listening test results showed that the introduction of the trajectory HMM improved the naturalness of synthetic speech.  相似文献   

16.
为了更好地表示文本语义信息,提高文本分类准确率,改进了特征权重计算方法,并融合特征向量与语义向量进行文本表示.首先基于文本复杂网络实现文本特征提取,接着利用网络节点统计特征改进TF-IDF得到特征向量,再基于LSTM抽取语义向量,最后将特征向量与语义向量相融合,使新的文本表示向量信息区分度更高.以网络新闻数据为实验对象的实验结果表明,改进特征权重计算方法,在特征向量中引入了语义和结构信息,并融合特征向量和语义向量,能进一步丰富文本信息,改善文本分类效果.  相似文献   

17.
基于隐马尔可夫模型(HMM)的手写字符识别方法是近年来的一个研究热点,针对HMM编码稳定性:郁建模过程复杂的问题,提出了一种新方法,即采用统计不相关最佳鉴别变换对模式进行特征抽取和降维,获得最佳鉴别特征向量.并在此基础上对各最佳鉴别方向的投影结果进行编码,作为HMM的观测值序列.由于统计不相关最佳鉴别变换保证了变换特征向量集类内散布最小.类间散布最大的条件,使HMM编码的稳定性和模式的可分性得到明显改善,通过对美国国家邮政局USPS手写字库的识别实验证实了该算法的准确性和鲁棒性。  相似文献   

18.
In this paper we present a new event analysis framework based on mixture hidden Markov model (HMM) for ice hockey videos. Hockey is a competitive sport and hockey videos are hard to analyze because of the homogeneity of its frame features. However, the temporal dynamics of hockey videos is highly structured. Using the mixture representation of local observations and Markov chain property of hockey event structure, we successfully model the hockey event as a mixture HMM. Based on the mixture HMM, the hockey event could be classified with high accuracy. Two types of mixture HMMs, Gaussian mixture and independent component analysis (ICA) mixture, are compared for the hockey video event classification. The results confirm our analysis that the mixture HMM is a suitable model to deal with videos with intensive activities. The new mixture HMM hockey event model could be a very useful tool for hockey game analysis.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号