首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
针对传统机器学习算法中仍需手工操作表示特征的问题,提出了一种基于堆栈式降噪自编码器(SDAE)深度网络的蛋白质亚细胞定位算法。首先,分别利用改进型伪氨基酸组成法(PseAAC)、伪位置特异性得分矩阵法(PsePSSM)和三联体编码法(CT)对蛋白质序列进行特征提取,并将这三种方法得到的特征向量进行融合,以得到一个全新的蛋白质序列特征表达模型;接着,将融合后的特征向量输入到SDAE深度网络里自动学习更有效的特征表示;然后选用Softmax回归分类器进行亚细胞的分类预测,并采用留一法在Viral proteins和Plant proteins两个数据集上进行交叉验证;最后,将所提算法的结果与mGOASVM、HybridGO-Loc等多种现有算法的结果进行比较。实验结果表明,所提算法在Viral proteins数据集上取得了98.24%的准确率,与mGOASVM算法相比提高了9.35个百分点;同时所提算法在Plant proteins数据集上取得了97.63%的准确率,比mGOASVM算法和HybridGO-Loc算法分别提高了10.21个百分点和4.07个百分点。综上说明所提算法可以有效提高蛋白质亚细胞定位预测的准确性。  相似文献   

2.
郭茂祖  张彬  赵玲玲  张昱 《计算机应用》2005,40(11):3159-3165
针对以往活动语义识别研究单纯提取时间维度上的序列特征以及周期特征、缺乏对空间信息的深度挖掘等问题,提出一种基于联合特征和极限梯度提升(XGBoost)的活动语义识别方法。首先,挖掘时间信息中的活动周期性特征和空间信息中的经纬度特征;然后,使用经纬度信息通过具有噪声的基于密度的聚类(DBSCAN)算法提取空间区域热度特征,将这些特征组成特征向量来刻画用户活动语义;最后,采用集成学习方法中的XGBoost算法建立活动语义识别模型。在FourSquare的两个公共签到数据集上,基于联合特征的模型比基于时间特征的模型在识别准确率上提高了28个百分点,与上下文感知混合(CAH)方法和时空活动偏好(STAP)方法对比,所提方法的识别准确率分别提高了30个百分点和5个百分点。实验结果表明所提方法与对比方法相比在活动语义识别问题上更加准确有效。  相似文献   

3.
使用伪氨基酸和集成分类器预测凋谢蛋白亚细胞定位   总被引:1,自引:1,他引:0  
预测凋谢蛋白质亚细胞定位是生物信息学和蛋白质科学中重要的研究内容.基于Chou的伪氨基酸组成概念,用近似熵表示蛋白质序列的附加特征,组成新的伪氨基酸组成表示序列特征.将蛋白质序列看作短时间序列,近似熵能够区分不同亚细胞定位中序列的复杂度.结合多个模糊K近邻分类器(基本分类器)的集成分类器作为预测工具.以不同维数的伪氨基酸组成向量,作为每个基本分类器的输入数据.3个常用的数据集用来测试算法的性能,Jackknife测试结果表明新算法有效和实用.有望发展成为亚细胞定位研究的有用工具.  相似文献   

4.
凋谢蛋白亚细胞定位预测是研究凋谢蛋白生物功能的 1 种重要的方法,也是生物信息学研究的重要领域之一.提高凋谢蛋白亚细胞定位预测模型准确性和实用性是该研究的重点.在本研究中,提出了以模糊 K 近邻分类算法作为基础分类器的集成分类算法.以蛋白质序列内不同间隔的二肽组成表示基本的蛋白质序列的特征集合,采用二进制粒子群算法作为特征选择方法提取能够有效的蛋白质序列特征.这些经过特征选择后的蛋白质序列特征作为集成分类算法中每一个基础分类器的输入向量.经过在2个常用的数据集上使用 Jackknife 测试,本文算法在 C1317 数据集上取得了 91.5% 的预测准确率,在ZW225数据集上取得了88.0%的准确率.与前人报道的算法预测结果比较,本文方法取得了较好的准确率.与使用相同数据集的已经报道凋谢蛋白亚细胞定位预测算法相比,本研究方法取得了预测准确率.  相似文献   

5.
王辉  李建红 《计算机应用》2023,(6):1750-1758
针对三维模型的分类问题,提出一种基于Transformer的三维(3D)模型小样本识别方法。首先,将支持和查询样本的3D点云模型输入特征提取模块中,以得到特征向量;然后,在Transformer模块中计算支持样本的注意力特征;最后,利用余弦相似性网络,计算查询与支持样本的关系分数。在ModelNet 40数据集上,相较于两层长短期记忆(Dual-LSTM)方法,所提方法的5-way 1-shot和5-way 5-shot的识别准确率分别提高了34.54和21.00个百分点;同时,所提方法在ShapeNet Core数据集上也取得了较高的准确率。实验结果表明,所提方法能够更准确地识别全新的3D模型类别。  相似文献   

6.
郭茂祖  张彬  赵玲玲  张昱 《计算机应用》2020,40(11):3159-3165
针对以往活动语义识别研究单纯提取时间维度上的序列特征以及周期特征、缺乏对空间信息的深度挖掘等问题,提出一种基于联合特征和极限梯度提升(XGBoost)的活动语义识别方法。首先,挖掘时间信息中的活动周期性特征和空间信息中的经纬度特征;然后,使用经纬度信息通过具有噪声的基于密度的聚类(DBSCAN)算法提取空间区域热度特征,将这些特征组成特征向量来刻画用户活动语义;最后,采用集成学习方法中的XGBoost算法建立活动语义识别模型。在FourSquare的两个公共签到数据集上,基于联合特征的模型比基于时间特征的模型在识别准确率上提高了28个百分点,与上下文感知混合(CAH)方法和时空活动偏好(STAP)方法对比,所提方法的识别准确率分别提高了30个百分点和5个百分点。实验结果表明所提方法与对比方法相比在活动语义识别问题上更加准确有效。  相似文献   

7.
现有的小样本学习算法未能充分提取细粒度图像的特征,导致细粒度图像分类准确率较低。为了更好地对基于度量的小样本细粒度图像分类算法中提取的特征进行建模,提出了一种基于自适应特征融合的小样本细粒度图像分类算法。在特征提取网络上设计了一种自适应特征融合嵌入网络,可以同时提取深层的强语义特征和浅层的位置结构特征,并使用自适应算法和注意力机制提取关键特征。在训练特征提取网络上采用单图训练和多图训练方法先后训练,在提取样本特征的同时关注样本之间的联系。为了使得同一类的特征向量在特征空间中的距离更加接近,不同类的特征向量的距离更大,对所提取的特征向量做特征分布转换、正交三角分解和归一化处理。提出的算法与其他9种算法进行实验对比,在多个细粒度数据集上评估了5 way 1 shot的准确率和5 way 5 shot的准确率。在Stanford Dogs数据集上的准确率提升了5.27和2.90个百分点,在Stanford Cars数据集上的准确率提升了3.29和4.23个百分点,在CUB-200数据集上的5 way 1 shot的准确率只比DLG略低0.82个百分点,但是5 way 5 shot上提升了1.55个百分点。  相似文献   

8.
叶利华  王磊  赵利平 《计算机应用》2017,37(7):2008-2013
针对低小慢无人机野外飞行场景复杂自主降落场景识别问题,提出了一种融合局部金字塔特征和卷积神经网络学习特征的野外场景识别算法。首先,将场景分为4×4和8×8块的小场景,使用方向梯度直方图(HOG)算法提取所有块的场景特征,所有特征首尾连接得到具有空间金字塔特性的特征向量。其次,设计一个针对场景分类的深度卷积神经网络,采用调优训练方法得到卷积神经网络模型,并提取深度网络学习特征。最后,连接两个特征得到最终场景特征,并使用支持向量机(SVM)分类器进行分类。所提算法在Sports-8、Scene-15、Indoor-67以及自建数据集上较传统手工特征方法的识别准确率提高了4个百分点以上。实验结果表明,所提算法能有效提升降落场景识别准确率。  相似文献   

9.
针对局部均值伪近邻(LMPNN)算法对k值敏感且忽略了每个属性对分类结果的不同影响等问题,提出了一种参数独立的加权局部均值伪近邻分类(PIW-LMPNN)算法。首先,利用差分进化算法的最新变体——基于成功历史记录的自适应参数差分进化(SHADE)算法对训练集样本进行优化,从而得到最佳k值和一组与类别相关的最佳权重;其次,计算样本间的距离时赋予每类的每个属性不同的权重,并对测试集样本进行分类。在15个实际数据集上进行了仿真实验,并把所提算法与其他8种分类算法进行了比较,实验结果表明,所提算法的分类准确率和F1值分别最大提高了约28个百分点和23.1个百分点;同时Wilcoxon符号秩检验、Friedman秩方差检验以及Hollander-Wolfe两处理的比较结果表明,所提出的改进算法在分类精度以及k值选择方面相较其他8种分类算法具有明显优势。  相似文献   

10.
针对已有的鼾声分类模型因未考虑实际睡眠时的其他声音而导致的泛化能力差、准确率较低等问题,提出一种基于注意力机制的NewVGG16双向门控循环单元(NVGG16-BiGRU-Att)算法用于鼾声识别。首先,生成每个声段的谱图,采用NVGG16网络提取语谱图、梅尔(Mel)时频图和恒Q变换(CQT)时频图组成的谱图特征矩阵;其次,将提取的特征向量输入BiGRU,结合注意力机制,增加分类过程中的重要特征信息的权重,改善分类效果;最后,经过全连接层输出鼾声与非鼾声。在采集的鼾声数据集上进行实验,实验结果表明,所提算法取得了较好的分类效果,其中Mel时频图效果最优,识别准确率达到96.18%;相较于卷积神经网络(CNN)+长短期记忆(LSTM)网络、卷积CNNsLSTMs-深度神经网络(DNNs)模型,在同特征输入下,所提算法的准确率提升了0.31%~2.39%,验证了所提算法具有较好的鲁棒性,能够提升分类性能。  相似文献   

11.
蛋白质亚细胞定位是蛋白质组学基本问题之一。某些类型蛋白质可能存在于两个或两个以上的亚细胞位置,这类蛋白质的亚细胞定位问题更为复杂。分别利用Gene Ontology和伪氨基酸成分法,将一条蛋白质表示为一实值向量;采纳多标记学习中的Ranking思想,计算出一得分向量V,该向量的每一分量的值表示被预测蛋白质属于某个亚细胞位置的概率;利用最近邻算法预测蛋白质所属亚细胞位置的个数n,得分向量V中得分最高的n个分量对应的亚细胞位置即为预测的位置。  相似文献   

12.
蛋白质亚细胞的定位预测不仅是研究蛋白质结构和功能的重要基础,还对了解某些疾病的发病机理、药物设计与发现具有重要意义。然而,如何利用机器学习精准预测蛋白质亚细胞的位置一直是一项具有挑战性的科学难题。针对这一问题,提出了一种基于聚类与特征融合的蛋白质亚细胞定位方法。首先将自相关系数法和熵密度法引入蛋白质特征表达模型的构建,并在传统的PseAAC(Pseudo-amino Acid Composition)的基础上提出了一种改进型PseAAC方法。为了更好地表达蛋白质序列信息,文中首先将自相关系数法、熵密度法和改进型PseAAC进行融合,构造了一种全新的蛋白质序列表征模型;然后利用主成分分析法对融合后的特征向量进行降维,将结果输入到LibD3C集成分类器,对蛋白质亚细胞进行分类预测,并采用留一法在Gram-positive和Gram-negative数据集上进行交叉检验;最后将取得的实验结果与其他现有算法进行比较。实验结果表明,所提方法在Gram-positive和Gram-negative数据集上分别取得了99.24%和95.33%的预测准确率,说明所提方法具有科学性和有效性。  相似文献   

13.
杨帅  王鹃 《计算机应用》2018,38(7):1866-1871
针对传统协同过滤算法仅利用评分信息作为推荐依据,没有利用用户评论和标签信息,无法准确反映用户对项目特征的偏好,推荐精确度低且容易过拟合等问题,提出一种基于堆栈降噪自编码(SDAE)改进的混合推荐(SDHR)算法。首先利用深度学习模型SDAE从用户自由文本标签中抽取项目的显式特征信息;然后,改进隐因子模型(LFM)算法,使用显式项目特征信息替换LFM中的抽象特征,进行矩阵分解训练;最后通过用户-项目偏好矩阵为用户提供推荐。在公开数据集MovieLens上的实验测试,与三组推荐模型(基于标签权重及协同过滤、基于SDAE和极限学习机、基于循环神经网络)比较,该算法推荐精确度分别提高了45.2%、38.4%和16.1%。实验结果表明,所提算法可以充分利用项目自由文本标签信息提高推荐性能。  相似文献   

14.
陈兴华  蔡云飞  唐印 《机器人》2020,42(4):485-493
点线特征结合的视觉SLAM(同步定位与地图构建)算法中,线特征匹配准确度差会引入新的误差,点线特征误差的累积加剧了数据关联失败情况的发生.针对这一问题,本文设计了一种基于点线不变量的线特征匹配方法,该点线不变量对线段与相邻2个特征点的局部几何关系进行编码,直接在现有特征点的基础上完成线匹配,可有效提高线段匹配的速度和准确度;此外,在点线特征的融合过程引入加权思想,根据场景特征丰富程度,在构造误差函数时对点线特征的权重进行合理分配.在TUM室内数据集和KITTI道路数据集上的实验表明,与现有的点线SLAM系统相比,本文提出的点线SLAM系统有效地提高了视觉SLAM中线特征匹配的准确度,提高了特征匹配环节的运行效率,使线特征在SLAM过程中发挥了积极有效的作用,提高了系统数据关联的稳定性.  相似文献   

15.

针对启发式特征选择策略忽略了特征间相关信息导致子最优的问题, 提出一种基于流形鉴别信息的特征选择(MDFS) 算法. 该算法根据近邻信息和标签信息刻画高维数据类内和类间流形结构, 以最小化流形散度差为准则构建目标函数, 并增加结构化稀疏正则项降低特征间冗余. 通过统一框架下的特征权重迭代优化获得最优特征子集. 在ORL 库、COIL20 库、Isolet1 库上的聚类实验表明, MDFS算法选取的特征子集相比传统算法具有更高的识别准确率和归一化互信息, 验证了所提出算法的有效性.

  相似文献   

16.
因短文本实体消歧具有不能完整地表达语义关系、上下文提供的信息较少等局限性。针对以上难点,该文提出了一种新的方法,混合卷积网络(Mixed Convolution Network,MCN)。该方法的核心思想是首先对数据集进行预处理;其次,采用Google提出的BERT模型进行特征提取,并通过注意力机制将特征进一步抽取后作为CNN模型的输入,通过CNN模型获得句子的依赖特征。同时,该文使用GCN模型获取语义特征,将二者提取到的语义信息融合,输出得到结果。在CCKS2019评测数据集上的实验结果表明,该文提出的混合卷积网络取得了86.57%的精确率,验证了该模型的有效性。  相似文献   

17.
针对通用目标检测算法在检测航空影像目标所表现的性能缺陷,提出一种改进Mask R-CNN算法用于航空影像的目标检测。该算法增加图像融合网络,将可见光图像与红外图像进行融合,消除目标被阴影遮蔽对检测造成的影响;同时改进了特征金字塔结构,使特征提取过程中的高层语义特征和低层定位信息得到充分融合,各尺度目标的检测精度得到提升;为解决小目标检测精度低和定位难度高的问题,该算法采用新型区域建议网络SD-RPN,在不同深度的卷积层设置合理大小的滑动窗口,用以检测不同尺度类型目标,使建议区域更加精准。实验结果表明,相比较主流检测算法,该算法在VEDAI数据集上表现出色,检测精度提升较大,尤其是小目标检测的精度提升显著。  相似文献   

18.
针对microRNA识别方法中过多注重新特征、忽略弱分类能力特征和冗余特征,导致敏感性和特异性指标不佳或两者不平衡的问题,提出一种基于特征聚类和随机子空间的集成算法CLUSTER-RS。该算法采用信息增益率剔除部分弱分类能力的特征后,利用信息熵度量特征之间相关性,对特征进行聚类,再从每个特征簇中随机选取等量特征组成特征集用于构建基分类器,最后将基分类器集成用于microRNA识别。通过调整参数、选择基分类器实现算法最优化后,在microRNA最新数据集上与经典方法Triplet-SVM、miPred、MiPred、microPred和HuntMi进行对比实验,结果显示CLUSTER-RS在识别中敏感性不及microPred但优于其他模型,特异性为六者最优,而且从整体性能指标准确性和马修兹系数可以看出,CLUSTER-RS比其他算法具有优势。结果表明,CLUSTER-RS取得了较好的识别效果,在敏感性和特异性上实现了很好的平衡,即在性能指标平衡方面优于对比方法。  相似文献   

19.
戎炜  蒋哲远  谢昭  吴克伟 《计算机应用》2020,40(9):2507-2513
目前群组行为识别方法没有充分利用群组关联信息而导致群组识别精度无法有效提升,针对这个问题,提出了基于近邻传播算法(AP)的层次关联模块的深度神经网络模型,命名为聚类关联网络(CRN)。首先,利用卷积神经网络(CNN)提取场景特征,再利用区域特征聚集提取场景中的人物特征。然后,利用AP的层次关联网络模块提取群组关联信息。最后,利用长短期记忆网络(LSTM)融合个体特征序列与群组关联信息,并得到最终的群组识别结果。与多流卷积神经网络(MSCNN)方法相比,CRN方法在Volleyball数据集与Collective Activity数据集上的识别准确率分别提升了5.39与3.33个百分点。与置信度能量循环网络(CERN)方法相比,CRN方法在Volleyball数据集与Collective Activity数据集上的识别准确率分别提升了8.7与3.14个百分点。实验结果表明,CRN方法在群体行为识别任务中拥有更高的识别准确精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号