共查询到19条相似文献,搜索用时 62 毫秒
1.
作者采用了基于模块性的图聚类算法来探测蛋白质相互作用网络中的集团,在具有2 617个节点11855个相互作用的酵母蛋白质相互作用网络中探测出177个集团,同时采用慕尼黑信息中心(Munich Information Center,MIPS)的层次功能注释对其进行了注释,并且验证得到的集团的确是内部连接紧密的子图。 相似文献
2.
图聚类法是利用蛋白质序列信息推断其家族分类的有力手段。对于蛋白质数据集中家族内外存在着如同许多超家族一样的复杂关系,图聚类法达到较好表现必须两因素,1)输入的相似性图需要包含有足够的用于分类的信息;2)需要稳健的算法以识别被隐藏在相似性图中的模糊集团。作者测试模块度最优算法Contraction-Dilation(CD)算法,采用来自于Pfam中的具有高度序列差异的烯醇酶宗族作为测试数据集。结果表明使用CD算法在相关参数与相似性图比较恰当的情况下,得到聚类结果与Pfam中高度一致。该算法能在一般情况下,使用最佳参数附近较宽范围仍能表现出较好性能。 相似文献
3.
图聚类法是利用蛋白质序列信息推断其家族分类的有力手段。对于蛋白质数据集中家族内外存在着如同许多超家族一样的复杂关系,图聚类法达到较好表现必须两因素,1)输入的相似性图需要包含有足够的用于分类的信息;2)需要稳健的算法以识别被隐藏在相似性图中的模糊集团。作者测试模块度最优算法Contraction-Dilation(CD)算法,采用来自于Pfam中的具有高度序列差异的烯醇酶宗族作为测试数据集。结果表明使用CD算法在相关参数与相似性图比较恰当的情况下,得到聚类结果与Pfam中高度一致。该算法能在一般情况下,使用最佳参数附近较宽范围仍能表现出较好性能。 相似文献
4.
采用分层聚类和熵评价方法进行基于功率谱的蛋白质序列特征提取新方法研究。具体包含以下3个内容:首先,基于经典的HP模型给出了氨基酸序列的数值序列表达;其次,采用离散傅里叶变换方法获取蛋白质序列的特征频谱,构造12维特征向量;最后,利用分层聚类法获取蛋白质序列的分层结构。这种新方法将基于功率谱的DNA序列特征提取方法推广到蛋白质序列上。通过基于19条动物线粒体脱氢酶亚基1和亚基4,以及11条β珠蛋白等3组数据的分层结构比较实验,结果表明,新方法在数据系统的分层结构的信息提取上优于基于功率谱的DNA序列分析方法。因此,新方法对确定未知基因的结构与功能有重要的生物意义。 相似文献
5.
基因组学和高通量技术提供了大量生命系统组成元件(如蛋白质)之间相互关系的数据,由这些关系数据构成的复杂生物网络蕴含着丰富的生命系统运行机制的知识,挖掘这些隐蔽的知识成为当前系统生物学的主要任务之一.作为知识发现重要手段的图聚类方法,在复杂生物网络分析上受到了普遍关注,在远同源性探测、蛋白质功能预测、代谢途径发现等方面取得了令人瞩目的结果.同时也注意到,由于生命系统的高度复杂性,其他领域中卓有成效的方法往往在复杂生物网络分析中遇到困难.评述了近年来图聚类算法在复杂生物网络分析中的进展,简要分析了复杂生物网络研究的图聚类途径所面临的主要问题. 相似文献
6.
传统胶囊网络(CapsNet)在计算时使用的动态路由算法需要多次迭代,针对这一问题,文章提出一种基于谱聚类的胶囊网络模型(Spectral Clustering Capsule Network,SC-Caps)并将其应用于文本分类任务.这种模型首先使用卷积层对文本进行特征提取,在初级胶囊层将提取的标量特征转化为向量特征,再利用谱聚类算法将高维的向量特征转化为较低维的子向量特征,并在卷积胶囊层学习局部与全局之间的关系映射.在搜狗语料库SougoCA进行实验,结果与LSTM、C-LSTM以及采用其他路由方法的胶囊网络进行比较,证明该算法有效提高了文本分类的分类效果. 相似文献
7.
谷物中现存大量未经注释、功能未知的蛋白质,且难以通过实验验证,因此计算方法成为预测谷物蛋白质功能的主流方法之一。作者以玉米、小麦、籼稻、粳稻4种谷物蛋白质为研究对象,利用数据库获取结构域相互作用信息。从蛋白质中较为稳定的结构域信息出发,结合AdaBoost算法获得蛋白质相互作用信息并构建蛋白质相互作用网络,将其与利用blast所获得的蛋白质序列相似性网络相结合,利用协同分类和多层感知机两种算法实现对谷物蛋白质的功能预测。研究结果显示,两种算法均能较为准确地预测蛋白质功能,其中协同分类在召回率方面表现更优,而多层感知机在准确率方面表现更优。本研究为谷物蛋白质的功能注释提供了新思路、新方法,对谷物的加工与营养研究提供了依据。 相似文献
8.
为了解决无线传感器网络中传感器节点数据传输效率低、数据延迟较高的问题,提出了一种基于分布式聚类的无线传感器网络数据传输方法.该方法通过节点聚类的方式,将无线传感器网络划分为多个分簇,根据每个分簇中传感器节点的剩余电量选取簇头节点,分簇内其传感器节点将收集的数据传输给簇头节点,再由簇头节点传输给基站.仿真结果表明,该方案能够有效提高无线传感器网络的数据传输效率,降低数据延迟,同时延长网络的生命周期. 相似文献
9.
大数据时代食品安全网络舆情的科学预警将有助于及时有效发现危机舆情,对于遏制食品安全谣言传播、促进社会和谐稳定具有重要意义。针对食品安全网络舆情的演变发展具有高度的不确定性、灰色性、模糊性等特点,基于三角模糊数确定网络舆情预警指标权重,通过建立灰色白化权函数对各指标灰色隶属度进行计算,建立基于灰色定权聚类的网络舆情预警模型,完成网络舆情等级的界定、划分与预警。通过对食品安全事件进行案例分析,验证了模型的有效性与实用性。 相似文献
10.
针对原始花粉算法寻优精度低,后期收敛速度慢等问题,提出加入高斯白噪声扰动改进花粉算法.利用改进后花粉算法强大的全局搜索能力优化K-means算法的初始聚类中心,通过基于距离的方法消弱孤立点对聚类的影响,并对该算法的性能进行验证和测试.实验结果表明该算法有效地避免了其陷入局部最优,改善了聚类性能. 相似文献
11.
高质量蛋白质结构及其对应基因序列数据是研究蛋白质折叠与蛋白质编码序列关系问题的基础.通过查询SWISS-PROT数据库中E.coli的蛋白质,得到不同数据库中的蛋白质结构与基因序列的交叉索引表,在此基础上,删除大量冗余及不可靠数据,最后得到一个高精度数据集EcoPDB.该数据集共有191个E.coli基因及其相应的精度好于2.5?的X射线衍射测定的PDB蛋白质结构数据,总残基数约5.5万. 相似文献
12.
基于余弦相似度的因子分析在食品成分检测中的应用 总被引:5,自引:0,他引:5
余弦相似度聚类不但体现了向量之间的相似关系,而且包含了向量内部元素的变化状况。研究了以角距离余弦为相似度的动态聚类方法,探讨了该方法的原理,研究了该方法的具体算法步骤,并利用大米样品的近红外光谱数据进行了验证。结果表明,通过对49个大米样本的光谱数据进行余弦相似度聚类分析,得到了9个特征因了,经与大米蛋白质含量参比值回归,其标准差为0.3,平均相对误差为2.3%,相关系数为0.9548。 相似文献
13.
氨基酸序列决定蛋白质高级结构是普遍接受的假设,也是蛋白质结构预测的理论基础.但近来不断有研究表明,同义密码子用语和蛋白质二级结构间存在着某些关联,这些结果可能对蛋白质折叠理论和基因工程有积极意义.本文对这一课题研究的最新进展情况进行了简要的分析与评述. 相似文献
14.
本文通过分析DfrA12蛋白的初级结构和空间构型,为进一步了解该蛋白的结构与功能提供了理论依据。应用Expasy、TMHMM2.0、SignalP 4.0、SOPMA、GENO3D等生物信息学软件对DfrA12蛋白的初级和高级结构进行分析和预测。结果显示,DfrA12蛋白由165个氨基酸组成,富含α螺旋和无规则卷曲结构,不形成跨膜区域,无信号肽,定位于细胞内膜。应用同源建模的方法成功构建了该蛋白的三维模型。本研究为深入探讨DfrA12蛋白的结构与生物学功能奠定了理论基础。 相似文献
15.
为得到更好的肉味香精前体物,采用复合蛋白酶对鸡肉蛋白进行水解研究,应用响应面分析法对水解条件进行优化。选用温度、pH 值、液固比和水解时间4 个反应因素,以蛋白质的水解度为评价指标,在单因素工艺试验的基础上,通过四因素三水平的Box-Behnken 响应面分析法优化鸡肉蛋白质的水解条件。结果表明,最优水解条件为温度51.13℃、水解pH6.99、液固比2.85:1(mL/g)、水解时间5.22h,在此水解条件下,水解度可达到35.22%。验证实验水解度为(35.09 ± 0.51)%,表明实验结果与软件优化结果相符。 相似文献
16.
17.
为显著提高杏鲍菇子实体蛋白提取率,采用超声波破碎辅助蜗牛酶水解充分破碎菌体细胞壁。综合应用响应面、正交设计与人工神经网络模型相结合的试验设计方法,分别对超声破碎处理和蜗牛酶水解条件进行了优化,同时与直接热水碱提蛋白法进行了比较。结果表明,超声处理条件为超声功率300 W、超声时间26 min、水料比1.95∶5(mL/g),在此条件下破碎效果最好,提取率达到了48.82%;最佳蜗牛酶水解条件为温度42.8 ℃、pH 4.8、酶用量7%、时间1.5 h,在该条件下蛋白提取率为75.92%,相较热水碱提法提高了33.35%,结果表明利用超声辅助蜗牛酶水解杏鲍菇细胞壁能显著提高蛋白提取率。 相似文献
18.
19.
牦牛肉是纯天然食品原料,然而牦牛肉蛋白资源的开发利用不够,特别是利用质构重组技术将牦牛肉中的肌原纤维蛋白和大豆分离蛋白用于开发凝胶产品鲜见研究报道。本研究以牦牛肌原纤维蛋白(myofibrillar proteinisolate,MPI)与热改性大豆分离蛋白(soybean protein isolate,SPI)为原料,分别采用单因素试验和正交试验设计,研究SPI-MPI溶液体积比、SPI热改性温度、离子强度和转谷氨酰胺酶(TGase)用量对共凝胶硬度、弹性和持水性的影响。单因素试验结果表明:改变4 个因素条件均能显著地提高热改性SPI-MPI溶液的凝胶性能,各因素对共凝胶特性综合指标影响的主次顺序为SPI-MPI溶液体积比>TG用量>离子强度>SPI热改性温度。正交试验结果表明形成共凝胶的最优条件是:SPI-MPI溶液体积比1∶9、SPI热改性温度100 ℃、TG用量50 U/g、不添加镁离子。 相似文献