排序方式: 共有26条查询结果,搜索用时 0 毫秒
1.
2.
随着深度学习应用的快速发展,神经网络模型的参数量变得越来越大,这意味着训练一个可用的神经网络模型需要更多的算力和更长的计算时间,因此如何提升神经网络训练的效率至关重要.然而训练效率在很大程度上取决于硬件后端和编译器.为了提升神经网络训练的性能,编译器的效率亟待提升,而这主要取决于计算图的优化、算子级别的优化和代码生成.主流的神经网络训练框架(如TensorFlow, PyTorch)使用了供应商特定的、通过手工设计算子获得的算子库.然而,手工设计算子浪费了大量的算子级别的优化空间,因此研究人员提出了TVM.作为一个端到端的编译器, TVM实现了算子级的自动优化,比现有框架进一步提高了性能.此外, TVM支持从多种神经网络框架中导入神经网络模型,并在不同主流硬件后端上部署.然而, TVM的注意力集中于提升神经网络推理任务的性能,并不支持神经网络的训练.本文提出了TVMT,第一个基于TVM、支持神经网络训练的端到端编译器.为了支持神经网络训练,本文提出了以下方法.(1)合并损失函数到现有的计算图中,以支持前向和后向传播;(2)在训练过程中采用设备到主机的机制来更新权重参数;(3)集成了最先... 相似文献
3.
目的研究冷喷涂用纳米结构Fe40Al合金粉末的球磨制备工艺及其在不同基体表面的冷喷涂沉积行为。方法以Fe粉、Al粉为原料,按照Fe-40Al进行配比混合,采用行星式球磨机制备纳米结构Fe40Al合金粉末,在不同硬度基体表面(不锈钢、低碳钢、纯铜及锡)冷喷涂沉积单个Fe40Al合金粉末颗粒。采用X射线衍射仪(XRD)、扫描电子显微镜(SEM),分析球磨过程中Fe40Al合金粉末的组织结构演变规律、粉末颗粒在不同基体表面的碰撞变形行为及沉积特性。结果球磨过程中,随着球磨时间的延长,Al扩散进入Fe晶格形成纳米结构Fe(Al)固溶体,球磨36 h后,Fe40Al合金粉末的晶粒尺寸约为35 nm,平均颗粒尺寸约为20μm,内部为精细层状结构。纳米结构Fe40Al合金粉末在硬度较高的不锈钢和低碳钢基体上沉积时,粉末颗粒发生强塑性变形而基体变形量较小,颗粒和基体间的结合较弱,沉积效果较差;当在硬度较低、塑性较好的Cu基体上沉积时,基体与粉末颗粒同时发生塑性变形,颗粒和基体间的结合较强,沉积效果最好;在硬度最低的Sn基体上沉积时,基体发生强烈的塑性变形且出现部分熔化,但颗粒几乎没有变形,且颗粒与基体间的结合很弱,沉积效果最差。结论采用球磨工艺可制备出适合冷喷涂用的纳米结构Fe40Al合金粉末,随着球磨时间的延长,粉末晶粒尺寸减小,硬度增加。基体种类对纳米结构Fe40Al合金粉末的冷喷涂沉积行为影响显著,基体硬度过高或过低均不利于粉末颗粒沉积,基体与粉末颗粒同时发生塑性变形有利于增强颗粒与基体间的界面结合,从而改善沉积效果。 相似文献
4.
5.
以Al80/Ti20(mass%)混合粉末为原料,采用冷喷涂法在低碳钢上沉积致密的Al/Ti基复合材料,对其在不同温度下(400、450、500、550和600℃)进行热处理,获得原位Al_3Ti金属间化合物颗粒增强Al基复合材料。采用扫描电镜、X射线衍射仪、显微硬度仪及磨损试验机研究了冷喷涂Al/Ti复合材料热处理前后的微观组织形貌、相结构、硬度及磨粒磨损性能的变化规律。结果表明:冷喷涂Al/Ti复合材料的相结构与喷涂粉末相同,涂层组织致密、颗粒间为机械结合;Al/Ti复合材料在450℃热处理后其局部区域开始通过扩散反应原位形成Al_3Ti金属间化合物,而在600℃热处理后初始Ti颗粒已全部转变为Al_3Ti金属间化合物颗粒,同时,涂层内部颗粒界面间结合显著改善,从而获得原位Al_3Ti/Al复合材料。随着热处理温度升高,原位Al_3Ti/Al复合材料硬度先下降后升高,而其磨粒磨损性能则在550℃热处理后显著增加。 相似文献
6.
7.
8.
“逐步提高城镇化水平,坚持大中小城市和小城镇协调发展,走中国特色的城镇化道路”是江泽民同志在十六大报告中关于城镇建设的指导思想,也是近一时期指导我们城镇建设的大政方针。而“发展小城镇要以现有的县城和有条件的建制镇为基础,科学规划、合理布局,同发展乡镇企业和农村服务结合起来。”是对小城镇建设工作方向的进一步明确。 相似文献
9.
分布式生物特征认证系统因不依赖弱口令或硬件标识物而获得高的可靠性、安全性和便利性,但也因生物特征存在永久失效和隐私泄露的风险而面临更多的安全威胁.基于同态加密技术的生物特征认证方案允许特征向量在密文域匹配以保护向量安全和用户隐私,但也因此要在密文域执行昂贵的乘法运算,而且还可能因为向量封装不当而遭受安全攻击.在Brakerski等人同态加密方案的基础上提出了一种安全向量匹配方法,并在该方法的基础上设计了一个口令辅助的生物特征同态认证协议.该协议无需令牌等硬件标识物,注册时只需将带有辅助向量的特征模板密文和辅助向量外包存储,认证时服务器使用辅助向量匹配法完成模板向量和请求向量的相似性评估即可实现用户身份认证.基于Dolev-Yao攻击者模型变种和分布式生物特征认证系统所面临的主要攻击手段对协议进行了安全性分析,并通过和另外2个基于RLWE(learning with error over ring)同态的生物特征认证协议的对比分析,证明了新协议在隐私保护和向量匹配效率方面更具优势. 相似文献
10.
为制备基体相晶粒细小、增强相均匀分布的SiC/Al纳米复合涂层,以Al、SiC为原料,采用高能球磨法获得SiC颗粒弥散分布的纳米晶Al基复合材料粉末,利用冷喷涂技术低温成型制备了SiC/Al纳米复合涂层,分析了SiC含量对复合涂层相结构、晶粒尺寸、微观结构、硬度及磨损性能的影响规律。结果表明:冷喷涂可实现球磨纳米晶复合粉末结构的原位移植,所制备SiC/Al纳米复合涂层组织致密,微米及亚微米级SiC弥散分布在纳米晶Al(约80 nm)基体之上;SiC颗粒对Al基体有明显强化作用,冷喷涂SiC/Al纳米复合涂层的硬度随SiC体积分数的增加而显著增加,50% SiC/Al纳米复合涂层的硬度高达515 HV0.3,约为Al块材的13倍;冷喷涂SiC/Al纳米复合涂层的耐磨损性能随着SiC含量增加而显著提高,涂层磨损失效机制为磨粒对基体的切削犁沟变形。 相似文献