共查询到18条相似文献,搜索用时 78 毫秒
1.
利用生物信息学快速准确鉴别酶、非酶蛋白及内含肽能极大提高实验效率,而测序数量的指数型增长使酶、非酶蛋白及内含肽的自动分类尤显重要。本文获取了同一性小于25%的序列共计3853条,采用Z标度的伪氨基酸组成和氨基酸组成分布提取序列特征值识别酶、非酶蛋白及内含肽。结果表明,该特征值提取方法经参数优化后,即当λ=5,w=0.15时,以支持向量机为分类器,其10倍交叉验证的精度可达81.3%,ROC曲线下面积为0.83;其精度高于其它方法0.5%到12.9%不等;独立样本测试的预测精度可达71.2%,ROC曲线下面积为0.782,其精度高于其它方法0.4%到6.4%不等,效果均优于其它常见的序列特征值方法。本文结果说明从序列出发判断其归属是可行的,3种不同功能的分子在序列特征上存在一定的差异,所建立的Z标度的伪氨基酸组成和氨基酸组成分布法可用于其它类似的生物信息学问题。建立了从序列出发预测酶、非酶蛋白及内含肽的新方法。 相似文献
2.
从序列出发预测水解酶亚家族类型具有重要意义.本文利用不同标度的伪氨基酸组成提取序列特征值,采用k-近邻算法预测水解酶亚家族类型.选择参数后,三种方法各自在最优运行参数下预测水解酶亚家族的准确率分别为:85.15%,82.65%和80.14%.其中以Z标度的伪氨基酸组成效果最佳,比氨基酸组成识别精度提高12.85%.本文研究结果说明从序列出发,预测水解酶亚家族是可行的,且修正的伪氨基酸组成可望成为一种新的有效提取蛋白质序列特征值的方法. 相似文献
3.
本文根据中文文本的特点,以一种新的同义概念来替代传统的词为单位,并给出了同义概念之间权值的全新计算方法。我们不仅考虑了文本中词汇概率信息,还结合文本语义等多方面来提取文本特征值,从而提出了一种基于多重启发式规则的中文文本特征值提取方法,并给出了特征值提取模型和算法。通过与传统特征值提取方法的比较实验,证证明本文中提出的特征值提取方法能有效地提高文本分类正确率,并达到了有效降低特征向量维数的目的。 相似文献
4.
一种基于语义分析的中文特征值提取方法 总被引:3,自引:2,他引:3
文章根据中文文本的特点,不仅考虑了文本中词汇概率信息,还结合了文本语义等多方面来提取文本特征值,从而提出了一种基于语义分析的中文文本特征值提取方法,并给出了具体算法。通过与传统特征值提取方法的比较试验,证明文中提出的特征值提取方法能有效提高文本分类正确率,并达到有效降低特征向量维数的目的。 相似文献
5.
郑海燕 《自动化技术与应用》2023,(11):95-97
提出一种基于多重启发式规则的英文特征值提取算法。该算法从概率论和英语语义两个层面引入了词频启发式规则、集中度启发式规则、同义启发式规则、同源启发式规则等特征值提取手段,阐述各种启发规则下的数据处理方法以及特征值提取算法具体流程,并将所提出的基于多重启发式规则的英文特征值提取算法与基于词频的常规算法进行对比,取得了较为理想的特征值提取效果。 相似文献
6.
7.
文章研究了基于特征值的智能故障诊断技术,具体阐述了特征值的提取方法,以及特征参数的建立方法及定义,并描述了智能故障诊断系统模型结构与开发策略。 相似文献
8.
通过改进指纹识别流程和预处理算法,使指纹识别系统能有较强的伪指纹判别性能.在指纹图像预处理环节计算多个前景灰度特征值,包括图像质量特征值、材质特征值和信息量特征值.选取特定的阈值,对前后采集的指纹图像特征值进行比较,判别是否为伪指纹图像.实验结果证明了该方法的有效性. 相似文献
9.
为维护操作系统的安全性和可靠性,提出了一个具备泛用能力、基于人工智能模型的网络入侵检测系统框架,其主要功能是针对来自互联网里各种形式的网络流量进行检测,并嗅探出可能的入侵攻击及恶意网络连接并将其归类.该框架首先使用采样、独热编码、特征选择和归一化将网络流量实例进行预处理,获取基本信息和筛选重要特征;然后利用网络连接实例的特征值分布建立评分机制,对数据进行信息再提取;最后针对不同的网络流量形式,利用不同的基于机器学习或深度学习的模型进行结果判断.实验中使用三个公开基准数据集KDDCup99、UNSW-NB15和CICIDS2017进行训练和测试.通过与相关文献比较,发现提出方法在三个数据集的正确率和F1得分上均有着优异的表现. 相似文献
10.
11.
Jie Cheng Author Vitae Author Vitae 《Computer aided design》2005,37(11):1115-1126
To capture the heterogeneity of biomaterials, a material feature based approach of heterogeneous bio-modelling is presented in this paper. The concept of material feature is defined as the specified material distribution of a certain sub-region within a solid, which is a high level abstraction of design intent. These material features are finally laid down on the function representations, which consist of material composition functions. The definition, formation and domain of material composition functions are formally presented. In order to facilitate the evaluation of material distribution, these functions are classified into component function and constraint function. Meanwhile, to capture the distinct material composition partition existing in medical objects, the material interface is introduced. The problem of overlapping and/or ambiguous of the feature domains is addressed. Finally, the feature tree for storing, evaluating of material features and tracing of design intents is proposed and the feature solving algorithm is presented. A prototype heterogeneous bio-modeling system is implemented based on open source graphics kernel VTK, with the help of translation layer to improve the system's efficiency and compatibility. 相似文献
12.
论文讨论了在学习情景中如何提取表情特征数据的方法。提取的数据包括眼帘间距和嘴角弧度,分别用于关注度与愉悦度的研究。在人脸图像上,先使用几何特征法划定出人眼的大概区域,再通过复杂度的计算与积分投影定位出双眼,以色调为依据制定搜索算法获得眼帘间距。在定位出双眼的基础上,进行嘴角与下唇中心点的定位,由三个特征点的坐标值计算出嘴角的弧度。实验证明该方法对不同的人脸图片有较好的适应性,较准确地提取出了所需的数据。 相似文献
13.
提出了两层混合分类器来预测蛋白质半胱氨酸氧化还原状态,第一层总体线性分类器利用氨基酸百分含量作为输入信息,第二层局部SVM分类器利用半胱氨酸周围局部序列作为输入信息。以2002年4月份的PISCES culled PDB数据库中的 639条蛋白质多肽链作为研究对象,共含有584条二硫键,2 904个半胱氨酸。经严格的折叠刀方法检验,预测半胱氨酸的氧化还原状态准确率最高可达84.1%(半胱氨酸水平)和80.1%(蛋白质水平)。结果表明这种将蛋白质总体信息与局部上下文序列信息结合起来构建的两层混和分类器具有较高的预测准确率。研究结果也表明总体氨基酸百分含量和半胱氨酸周围局部序列都携带有二硫键形成的相关信息,暗示了半胱氨酸是否形成二硫键不但取决于蛋白质全局的结构信息同时也受到局部序列信息的影响。 相似文献
14.
情感分析也称为意见挖掘,是对文本中所包含的情感倾向进行分析的技术。目前很多情感分析工作都是基于纯文本的。而在微博上,除了文本,大量的图片信息也蕴含了丰富的情感信息。本文提出了一种基于文本和图像的多模态分类算法,通过使用潜在语义分析,将文本特征和图像特征分别映射到同维度下的语义空间,得到各自的语义特征,并用SVM-2K进行分类。利用新浪微博热门微博栏目下爬取的文字和配图的微博数据进行了实验。实验结果表明,通过融合文本和图像的语义特征,情感分类的效果好于单独使用文本特征或者图像特征。 相似文献
15.
16.
针对目前卷积神经网络提取图像特征不充分导致的显著性提取效果不明显的问题,提出了一种多层卷积特征融合的自编码显著性区域提取算法.在使用卷积网络提取图像特征时,其浅层卷积特征一般提取的是图像的细节特征如颜色、纹理和位置特征,深层次卷积特征一般是图像的语义特征,在编码层将浅层卷积特征经过下采样融合到深层次的卷积特征中,并将深层次卷积特征进行上采样融合到浅层卷积特征中,实验表明这样可以大大提高编码质量;在解码中将编码时的卷积特征也进行融合,可以获取到解码丢失的信息进而得到更优的解码图像.此外还设计了逐层监督的方式来指导解码层的训练,即用标准的区域提取图进行下采样作为每一层解码层的标准图进行监督训练.实验结果表明,该方法可以在PAGRN的基础上将F度量平均提升0.071,平均绝对误差MEA平均降低0.031. 相似文献
17.
在无线体域网中,传统的基于生物特征提取和表征方法不适用于脉搏生物密钥算法生成,并且无法满足无线体域网对低能耗的要求。为了满足无线体域网对低能耗的要求,本文提出了一种基于集合测度和多项式重构技术的脉搏生物特征密钥表征方案,并设计了基于脉搏生理特征的无线体域网密钥分发技术。实验结果表明:本文提出的表征方法比有序二进制编码在准确性上更好,该脉搏生物特征表示方法能为生物密钥算法奠定准确而合适的生物特征数据表征基础。同时,本文中设计的密钥分发技术亦可以显著减小密钥分发的安全模板长度,降低密钥分发过程中产生的能耗。 相似文献
18.
虹膜纹理的方向特征在虹膜识别中具有重要地位。利用2D Gabor小波的方向选择性,对虹膜纹理的方向分布特性进行了分析,由分析结果发现:可供识别的虹膜纹理特征主要沿虹膜圆周方向分布,在此基础上提出单方向特征提取虹膜识别算法。实验表明,与多方向特征提取相比,只沿圆周方向对虹膜进行特征提取不仅编码短,而且识别效果更好。 相似文献