期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

汪涛靳聪李小兵帖云齐林《计算机应用》2021,41(12):3585-3589

符号音乐的生成在人工智能领域中仍然是一个尚未解决的问题,面临着诸多挑战。经研究发现,现有的多音轨音乐生成方法在旋律、节奏及和谐度上均达不到市场所要求的效果,并且生成的音乐大多不符合基础的乐理知识。为了解决以上问题,提出一种新颖的基于Transformer的多音轨音乐生成对抗网络（Transformer-GAN）,以乐理规则为指导来产生具有高音乐性的音乐作品。首先,采用Transformer的译码部分与在Transformer基础之上改编的Cross-Track Transformer（CT-Transformer）分别对单音轨内部及多音轨之间的信息进行学习;然后,使用乐理规则和交叉熵损失相结合的方法引导生成网络的训练,并在训练鉴别网络的同时优化精心设计的目标损失函数;最后,生成具有旋律性、节奏性及和谐性的多音轨音乐作品。实验结果表明,与其他多乐器音乐生成模型相比,在钢琴轨、吉他轨及贝斯轨上,Transformer-GAN的预测精确度（PA）最低分别提升了12%、11%及22%,序列相似度（SS）最低分别提升了13%、6%及10%,休止符指标最低分别提升了8%、4%及17%。由此可见,Transformer-GAN在加入了CT-Transformer及音乐规则奖励模块之后能有效提升音乐的PA、SS等指标,使生成的音乐质量整体上有较大的提升。相似文献

2.

A3C深度强化学习模型压缩及知识抽取

张晶王子铭任永功《计算机研究与发展》2023,(6):1373-1384

异步优势演员评论家(asynchronous advantage actor-critic,A3C)构建一主多从异步并行深度强化学习框架,其在最优策略探索中存在求解高方差问题,使主智能体难以保证全局最优参数更新及最佳策略学习.同时,利用百万计算资源构建的大规模并行网络,难以部署低功耗近端平台.针对上述问题,提出紧凑异步优势演员评论家(Compact＿A3C)模型,实现模型压缩及知识抽取.该模型冻结并评价A3C框架中所有子智能体学习效果,将评价结果转化为主智能体更新概率,保证全局最优策略获取,提升大规模网络资源利用率.进一步,模型将优化主智能体作为“教师网络”,监督小规模“学生网络”前期探索与策略引导,并构建线性衰减损失函数鼓励“学生网络”对复杂环境自由探索,强化自主学习能力,实现大规模A3C模型知识抽取及网络压缩.建立不同压缩比“学生网络”,在流行Gym Classic Control与Atari 2600环境中达到了与大规模“教师网络”一致的学习效果.模型代码公布在https://github.com/meadewaking/Compact＿A3C. 相似文献

3.

基于强化学习Actor-Critic算法的音乐生成

白勇齐林帖云《计算机应用与软件》2020,37(5):118-122,182

相似文献

4.

加入奖励的GRU对抗网络文本生成模型

彭鹏菲周琳茹《计算机与现代化》2022,(7):121-126

针对目前生成对抗网络文本生成模型采用有监督形式造成的错误累计以及生成文本信息单一等问题,提出一种基于GRU生成对抗网络的文本生成模型,GRU生成器采用策略梯度进行参数更新,且该模型增加蒙特卡洛搜索推导生成样本序列。采用参数较少的GRU神经网络作为生成器和判别器,判别器的输出loss函数指导生成过程中的参数优化,以蒙特卡洛策略思想补充生成过程中的非完整序列,减少错误累计并增加文本生成信息的丰富性。引入门截断机制,用自定义函数替换GRU网络中的sigmoid函数,改进当前时刻的隐含变量的激活函数,改善原函数收敛速度较慢且容易产生梯度消失问题,使之更适应本文模型。仿真实验结果表明本文模型丰富了文本生成的多样性,提高了模型的收敛速度,验证了本模型的有效性。该模型有较好的应用性。相似文献

5.

基于协同过滤和对象模型的音乐推荐系统研究

陈继腾陈平华《计算机与数字工程》2020,48(8):1892-1896,1918

相似文献

6.

基于扩展对象模型的界面自动生成 总被引：1，自引：0，他引：1

蔡珣蔡菲万建成《计算机应用与软件》2004,21(6):23-24,62

根据界面工程设计和自动化的需要,本文提出了基于FMP模型中的扩展对象模型的自动生成方法。界面自动生成是根据扩展对象模型中的对象描述信息,通过指定不同的布局策略在界面的特定区域中实现的不同界面布局。实验结果表明本文提出的方法具有相当的应用价值。相似文献

7.

基于云模型的科技奖励评审模型研究

黄卫春刘建林《计算机工程与科学》2011,33(11):149

云模型是实现定性概念与定量表示之间不确定性转换的模型,它把模糊性和随机性有机结合起来。本文提出了一种基于云模型的科技奖励评审模型,利用云模型客观描述项目的评分在各属性下的分布情况,通过计算云模型参数来确定云模型数字特征图或云滴分布情况,并以此确定最后等级。结果表明,该模型能够解决项目单一属性分类及非共识等问题,同时能够客观地反映出项目实际综合评审结果,从而使得评审更加公平合理。相似文献

8.

基于Agent辩论谈判的奖励模型研究

伍京华蒋国瑞黄梯云《计算机工程与应用》2006,42(36):172-175

电子商务谈判过程中,由于能使接受辩论的Agent根据它所接受到的辩论改变其偏好或目标,从而使谈判双方更快更好地达成一致,因而基于辩论的Agent谈判方式受到了广泛关注。目前已经有文献对此作了一定程度的研究,然而较少有对其中客观存在的威胁、奖励和申辩进行有效地形式化建模和描述。目标主要在于研究其中的奖励模型和其评价模型,然后在此基础上对奖励的评价模型进行模拟和分析,以评价其辩论力度的强弱,使被奖励对象最终做出正确选择。相似文献

9.

基于深度强化学习的多模态医学图像配准

姚明青胡靖《计算机辅助设计与图形学学报》2020,32(8):1236-1247

传统图像配准方法中,图像特征的表示和相似性测度的选择易受到人为因素的影响,不能准确地表征图像特征和配准图像的相似度,从而对配准结果产生较大误差.针对此问题,借助端到端的强化学习方法,对这2个部分进行隐式的表达,从而避免人工设计的缺陷.具体而言,设计了一个人工智能体模型,由策略网络和价值网络2部分组成,用以指导浮动图像朝着参考图像的方向正确移动,进而实现图像配准.提出使用异步表演者-评论家方法进行模型训练,以避免经验回放操作,降低模型训练对存储容量的要求并加快模型的收敛;同时提出一种奖赏函数,能够给予每个时间步上图像配准动作估计更为准确的奖励.此外,在测试阶段,使用了蒙特卡罗前向推理策略,进一步提高配准参数的准确性.在MR和CT的临床医学图像配准数据集上进行实验,与传统基于尺度不变性配准算法、基于深度学习配准算法等进行对照分析,实验结果表明,所提出的方法目标配准误差可以减少30%左右,同时能够更好地处理具有大幅度形变的配准问题. 相似文献

10.

基于RNN的化工过程软测量模型研究 总被引：5，自引：2，他引：3

陆婷罗飞毛宗源《计算机测量与控制》2004,12(4):310-313

研究了基于回归神经网络(RNN)为化工颜料锌钡白建立质量指标软测量模型的问题。利用SPSS统计软件对过程历史数据进行预分析处理,进而利用这些数据训练回归神经网络,建立质量指标消色力的软测量模型。针对回归神经网络训练效率低,泛化能力差等问题,尝试引入一种初始权值优化方法加以改进。仿真结果表明,利用回归神经网络可以为此类化工过程建立具有一定预测能力的软测量模型,引入的初始权值优化方法有助于提高回归神经网络初始训效率,但模型的泛化能力还有待进一步改进。相似文献

11.

基于双重注意力机制的异步优势行动者评论家算法

凌兴宏李杰朱斐刘全伏玉琛《计算机学报》2020,43(1):93-106

深度强化学习是目前机器学习领域发展最快的技术之一.传统的深度强化学习方法在处理高维度大状态的空间任务时,庞大的计算量导致其训练时间过长.虽然异步深度强化学习利用异步方法极大缩短了训练时间,但会忽略某些更具价值的图像区域和图像特征.针对上述问题,本文提出了一种基于双重注意力机制的异步优势行动者评论家算法.新算法利用特征注意力机制和视觉注意力机制来改进传统的异步深度强化学习模型.其中,特征注意力机制为卷积神经网络卷积后的所有特征图设置不同的权重,使得智能体聚焦于重要的图像特征;同时,视觉注意力机制为图像不同区域设置权重参数,权重高的区域表示该区域信息对智能体后续的策略学习有重要价值,帮助智能体更高效地学习到最优策略.新算法引入双重注意力机制,从表层和深层两个角度对图像进行编码表征,帮助智能体将聚焦点集中在重要的图像区域和图像特征上.最后,通过Atari 2600部分经典实验验证了基于双重注意力机制的异步优势行动者评论家算法的有效性. 相似文献

12.

基于异步优势动作评价的RFID室内定位算法

李丽郑嘉利王哲袁源石静《计算机科学》2020,47(2):233-238

针对现有的RFID室内定位算法的精度容易受到环境因素影响的问题,提出了一种基于异步优势动作评价(Asynchronous Advantage Actor-critic,A3C)的RFID室内定位算法。该算法的主要步骤为:1)将RFID的信号强度RSSI值作为输入值,多个线程子动作网络并行交互采样学习,利用子评价网络评价动作值的优劣,使模型不断优化,找到最优信号强度RSSI值,并训练定位模型;子线程网络定期将网络参数异步更新到全局网络上,全局网络最后输出参考标签的具体位置,同时训练得到异步优势动作评价定位模型。2)在线定位阶段,当待测目标进入待测区域时,记录待测目标的信号强度RSSI值,将其输入异步优势动作评价定位模型中,子线程网络从全局网络中获取最新定位信息,对待测目标进行定位,最后输出目标的具体位置。实验数据表明,基于异步优势动作评价的RFID室内定位算法与传统的基于向量机(Support Vector Machines,SVM)定位、基于极限学习机(Extreme Learning Machine,ELM)定位、基于多层神经网络定位(Multi-Layer Perceptron,M... 相似文献

13.

基于异步优势执行器评价器的自适应PID控制

下载免费PDF全文

段友祥任辉孙歧峰闫亚男《计算机测量与控制》2019,27(2):70-73

自适应PID较好地解决了传统PID无法自整定参数的问题,已成为控制领域内的研究热点。研究基于异步优势执行器评价器(Asynchronous Advantage Actor-Critic,A3C)算法设计了一种新的自适应PID控制器。该控制器利用A3C结构的多线程异步学习特性,并行训练多个执行器评价器(Actor-Critic,AC)结构的智能体,每个智能体采用多层前馈神经网络逼近策略函数和值函数实现在连续动作空间中搜索最优的参数整定策略,以达到最佳的控制效果。与已有的多种自适应PID控制器性能对比分析结果表明该方法具有收敛速度快,自适应能力强的特点。相似文献

14.

面向精准价格牌识别的多任务循环神经网络

牟永强范宝杰孙超严蕤郭怡适《自动化学报》2022,48(2):608-614

为了促进智能新零售在线下业务场景的发展,提高作为销售关键信息价格牌的识别精度.本文对价格牌识别问题进行研究,有效地提高了价格牌的识别精度,并解决小数点定位不准确的难题.通过深度卷积神经网络提取价格牌的深度语义表达特征,将提取到的特征图送入多任务循环网络层进行编码,然后根据解码网络设计的注意力机制解码出价格数字,最后将多个分支的结果整合并输出完整价格.本文所提出的方法能够非常有效地提高线下零售场景价格牌的识别精度,并解决了一些领域难题如小数点的定位问题,此外,为了验证本文方法的普适性,在其他场景数据集上进行了对比实验,相关结果也验证了本文方法的有效性. 相似文献

15.

阿基米德曲线和渐开线的逐点生成算法 总被引：5，自引：0，他引：5

高云刘勇奎黄有群《计算机辅助设计与图形学学报》2002,14(6):505-508

阿基米德曲线和渐开线广泛应用于工程绘图中，但目前对这类曲线的生成算法的研究却很少，尤其是逐点生成算法。文中提出新的该类曲线的逐点生成算法，在逐点生成中找到一种有效的步长求取方法；在迭代过程中避免了三解函数的运算，每步仅需两次乘法，并且充分利用对称性，只计算一个八分象限的点。在整个运算过程中保证误差在√2/2象素之内。相似文献

16.

Robustness Assessment of Asynchronous Advantage Actor-Critic Based on Dynamic Skewness and Sparseness Computation:A Parallel Computing View

下载免费PDF全文

Tong Chen Ji-Qiang Liu He Li Shuo-Ru Wang Wen-Jia Niu En-Dong Tong Liang Chang Qi Alfred Chen Gang Li 《计算机科学技术学报》2021,36(5):1002-1021

Reinforcement learning as autonomous learning is greatly driving artificial intelligence (AI) development to practical applications.Having demonstrated the potential to significantly improve synchronously parallel learning,the para-llel computing based asynchronous advantage actor-critic (A3C) opens a new door for reinforcement learning.Unfortunately,the acceleration's influence on A3C robustness has been largely overlooked.In this paper,we perform the first robustness assessment of A3C based on parallel computing.By perceiving the policy's action,we construct a global matrix of action probability deviation and define two novel measures of skewness and sparseness to form an integral robustness measure.Based on such static assessment,we then develop a dynamic robustness assessing algorithm through situational whole-space state sampling of changing episodes.Extensive experiments with different combinations of agent number and learning rate are implemented on an A3C-based pathfinding application,demonstrating that our proposed robustness assessment can effectively measure the robustness of A3C,which can achieve an accuracy of 83.3％. 相似文献

17.

An Interactive Case-Based Reasoning Approach for Generating Expressive Music

Josep Lluís Arcos Ramon López De Mántaras 《Applied Intelligence》2001,14(1):115-129

In this paper we present an extension of an existing system, called SaxEx, capable of generating expressive musical performances based on Case-Based Reasoning (CBR) techniques. The previous version of SaxEx used pre-fixed criteria within the different CBR steps and, therefore, there was no room for user interaction. This paper discusses the necessity of user interaction during the CBR process and how this decision enhances the capabilities and the usability of the system. The set of evaluation experiments conducted show the advantages of SaxEx's new interactive functionality, particularly for future educational applications of the system. 相似文献

18.

分形音乐计算机生成技术研究

沈小锋《数字社区&智能家居》2007,2(7):244-245

分形科学在经济、化工、计算机等各领域有着广泛的应用。在计算机科学方面,分形科学的应用有分形艺术图像的生成和图像分形压缩。而在音乐作曲领域,音乐学者对古典音乐的分析中,发现音乐也有分形性。既然音乐具有分形性,本文从计算机技术方面对分形音乐的自动生产做研究,探讨计算机分形音乐的算法。相似文献

19.

分形音乐计算机生成技术研究

沈小锋《数字社区&智能家居》2007,(4):244-245

分形科学在经济、化工、计算机等各领域有着广泛的应用。在计算机科学方面，分形科学的应用有分形艺术图像的生成和图像分形压缩。而在音乐作曲领域，音乐学者对古典音乐的分析中，发现音乐也有分形性。既然音乐具有分形性，本文从计算机技术方面对分形音乐的自动生产做研究，探讨计算机分形音乐的算法。相似文献

20.

Making Beautiful Music With Dsps

Lutz M.J. 《Computer》1997,30(10):114-114

相似文献