首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
《Planning》2018,(7)
针对环境适老化改造推荐方案中改造项具有先后顺序的情形,将校准标签排序与多标签k近邻算法相结合,提出适于适老化改造推荐的多标签学习算法。首先引入校准标签约束不相关项,文章将多标签排序问题进行转化为标签成对比较的多分类问题,然后利用ML-k NN进行多标签分类,最后重构标签对关系矩阵,取统计票数大于校准标签的标签项为相关标签并根据票数进行排序。通过实际老人数据集进行测试,与传统的成对比较排序法与校准标签法进行比较,结果表明校准标签排序与多标签k近邻算法相结合汉明损失更小,平均精度更高,且保持较低的错误率,更适合于适老化改造方案推荐。  相似文献   

2.
《Planning》2017,(6):607-611
随着基因组学相关技术的快速发展,如何处理和利用海量的数据问题越来越重要,人类复杂疾病与基因、miRNA和lncRNA的关系也成为研究的热点之一.先阐述了随机游走算法的基本原理,随后分析了几类基于随机游走算法在基因、miRNA和lncRNA与疾病关系预测中的应用研究,最后对随机游走预测算在疾病相关关系预测方面的应用作了总结和展望.  相似文献   

3.
《Planning》2014,(6)
目的利用基因工程技术获取原核表达的C11orf17蛋白,结合生物信息学初步预测其功能。方法以K562细胞的cDNA为模板,PCR扩增C11orf17的基因序列;双酶切后将目的基因亚克隆至原核表达载体pET-32a上,将测序正确的重组表达质粒pET-32a-C11orf17转化到E.coli BL21,经诱导后SDS-PAGE及Western blot检测融合蛋白表达,并分析其可溶性。采用UGET软件预测C11orf17共表达基因,蛋白质互作数据库挖掘C11orf17基因已知互作蛋白,在线软件Gather富集共表达基因生物功能。结果成功构建重组表达质粒pET-32aC11orf17,此重组体经诱导后能在E.coli BL21高效表达C11orf17的融合蛋白,UGET分析C11orf17前300共表达探针中,包含267个已知基因,共表达基因主要富集细胞交流、信号传导、细胞周期基因功能本体。蛋白互作数据库表明,C11orf17与PRKACA蛋白互作,后者为细胞周期调控重要分子。结论在原核细胞中成功表达出C11orf17蛋白,生物信息预测其可能是细胞周期调控重要新分子,为后续研究提供了方向和线索。  相似文献   

4.
《Planning》2014,(2)
近邻查询问题是基于位置的查询的重要问题之一,是要找到距离查询点最近的k个对象的集合。无线数据广播技术能够有效地避免C/S模式在处理海量数据时的弊端,也能够对用户的位置信息进行隐私保护。将无线数据广播技术应用到k近邻查询中,利用Hilbert曲线组织空间结构,结合无线数据广播技术具有线性的特性,通过过滤和剪枝两个步骤,最终找到查询点的k个最近邻集合。  相似文献   

5.
将燃气日瞬时流量和日用气量作为研究对象,提出基于K-means聚类、特征标签、用户画像、k折交叉验证和岭回归的用气负荷异常检测方法。结合实例,对该异常检测方法进行探讨。将案例用户某段时间的瞬时流量组成数据集,使用K-means算法进行聚类分析,将用气分为工艺生产和停工小火两类用气行为,得到工艺生产数据集。针对工艺生产数据集中的每个样本,得到6个特征标签(日最大负荷、日均负荷、日用气时段百分比、日用气量、用气负荷相似度、用气负荷冲击度)。将特征标签归一化后绘制修正箱线图,即用户画像,剔除了异常样本。使用k折交叉验证和岭回归算法构建异常评价标准。利用岭回归算法构建异常评价模型。将案例用户另一段时间的瞬时流量输入异常评价模型,进行负荷异常检测,与实际结果对照,得到该异常检测方法的准确率达到90%以上。  相似文献   

6.
《Planning》2014,(7)
针对蚁群算法在大规模蛋白质相互作用(protein-protein interaction,PPI)网络中进行功能模块检测所暴露的时间性能方面的不足,提出了一种基于多粒度描述和蚁群优化的快速求解算法。首先,从粒度计算的角度,给出了一种新的多粒度PPI网络描述模型;然后,基于该模型,设计了融合功能和结构信息的粒度划分,粗粒度的蚁群寻优,解的还原与优化3个阶段的求解过程。在大规模PPI网络上的实验表明:算法在保证检测质量的同时,能显著降低利用蚁群算法进行功能模块检测的求解时间,而且与近年来的一些经典算法相比在检测精度上也具有一定的优势。  相似文献   

7.
《Planning》2017,(6)
为进一步开发大竹蛏Solen grandis的基因资源,采用2代Illumina Hi-seq测序技术对大竹蛏的鳃组织进行了转录组测序,构建了转录组数据库,获得338 483 476条Clean Reads数据;拼接组装后获得190 856条Unigene数据,平均长度为1147 bp;与NR、NT、KO、Swiss Prot、PFAM、GO、KOG等数据库进行Blast信息比对(E-value为10-5),共获得63 337个注释基因;与NR数据库比对发现,大竹蛏转录组基因序列与长牡蛎Crassostrea gigas具有较高的同源性,为53.3%;将大竹蛏转录组的Unigene的功能通过与KOG数据库进行注释比对划分为25类;GO数据库注释可分为三类,即细胞组分、生物过程和分子功能,共包括65个分支;KEGG分析发现,大竹蛏转录组数据中按照代谢通路可分为92类,利用Blast蛋白库比对和Estscan软件进行ORF预测,获得长度大于300 nt的ORF共50 681个;通过SSR分析,共获得73 089个SSR标记。本研究中获得的转录组信息可为今后进行大竹蛏分子标记的开发和关键基因的克隆及功能分析等研究提供基础数据。  相似文献   

8.
《Planning》2022,(6)
为进一步开发大竹蛏Solen grandis的基因资源,采用2代Illumina Hi-seq测序技术对大竹蛏的鳃组织进行了转录组测序,构建了转录组数据库,获得338 483 476条Clean Reads数据;拼接组装后获得190 856条Unigene数据,平均长度为1147 bp;与NR、NT、KO、Swiss Prot、PFAM、GO、KOG等数据库进行Blast信息比对(E-value为10-5),共获得63 337个注释基因;与NR数据库比对发现,大竹蛏转录组基因序列与长牡蛎Crassostrea gigas具有较高的同源性,为53.3%;将大竹蛏转录组的Unigene的功能通过与KOG数据库进行注释比对划分为25类;GO数据库注释可分为三类,即细胞组分、生物过程和分子功能,共包括65个分支;KEGG分析发现,大竹蛏转录组数据中按照代谢通路可分为92类,利用Blast蛋白库比对和Estscan软件进行ORF预测,获得长度大于300 nt的ORF共50 681个;通过SSR分析,共获得73 089个SSR标记。本研究中获得的转录组信息可为今后进行大竹蛏分子标记的开发和关键基因的克隆及功能分析等研究提供基础数据。  相似文献   

9.
文章基于多源数据融合方法,从客流水平、居民需求、接驳特性、周边设施4个维度对轨道站点特征进行提取与构建。采用PAM算法对站点进行聚类研究,最终形成6类站点画像的标签。在此基础上探索站点功能定位、客流模式之间的内在关系,梳理不同类型站点在城市化进程中面临的阶段性矛盾,指导客流预测任务、引流策略制定等后续工作。  相似文献   

10.
将机器学习与火灾风险评估相结合,建立定量化高层建筑火灾风险评估模型。总结现有评估方法,并对机器学习及涉及到的学习算法进行介绍,然后建立评价模型。评价模型采用One-Hot、Word2vec和LDA进行数据预处理,应用高斯贝叶斯分类器、k近邻、随机森林、AdaBoost进行建模训练和预测,并提出采用错误率和代价敏感错误率进行模型精度评价。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号