期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

胡青李倩聂小丽周毕吉杨维安《软件工程师》2005,(8):39-41

如今网络是一个盛行“Q言Q语”的年代,一些新词新语层出不穷,他们不仅流行于网络,而且被QQ族带到社会生活中来。语言是一种表达的工具,它总是在社会的发展中破陈出新,如五四时期的白话文与文言文之争。如今,网络语言是不是也要“革”现代汉语的“命”? 相似文献

2.

大话“Q言Q语”

《软件工程师》2005,(6):37

如今网络是一个盛行“Q言Q语”的年代——“200”（公园）、“DD”（弟弟）、“GF”（女朋友）、“PMP”（拍马屁）、“酱紫”（这样子），“偶（我）”、“KPM”（肯德基、比萨饼、麦当劳）。相似文献

3.

基于优势学习的深度Q网络

下载免费PDF全文

夏宗涛秦进《计算机工程与应用》2019,55(20):101-106

强化学习问题中，同一状态下不同动作所对应的状态-动作值存在差距过小的现象，Q-Learning算法采用MAX进行动作选择时会出现过估计问题，且结合了Q-Learning的深度Q网络（Deep Q Net）同样存在过估计问题。为了缓解深度Q网络中存在的过估计问题，提出一种基于优势学习的深度Q网络，通过优势学习的方法构造一个更正项，利用目标值网络对更正项进行建模，同时与深度Q网络的评估函数进行求和作为新的评估函数。当选择的动作是最优动作时，更正项为零，不对评估函数的值进行改动，当选择的动作不是最优动作时，更正项的值为负，降低了非最优动作的评估值。和传统的深度Q网络相比，基于优势学习的深度Q网络在Playing Atari 2600的控制问题breakout、seaquest、phoenix、amidar中取得了更高的平均奖赏值，在krull、seaquest中取得了更加稳定的策略。相似文献

4.

防止自己的ADSL账号被人刷Q币

小地瓜《电脑应用文萃》2005,(12):106-106

网络上每隔几天都会出现不同的刷Q币教程．所讲述的资料内容．经笔取证实效性都很强．不少ADSL用户都深受其害．造成经济上的损失。更可怕的是目前有很多菜鸟“黑客”，按照网上所提供的资料积极地进行演练。相信大家一定不想让他们刷Q币到自己的“头上”，那么一起来学习下防御方法吧！相似文献

5.

设好密保防线预防Q币被盗

郭成贺《电脑爱好者》2011,(7):32-32

前几天舍友的QQ会员到期了，于是打算用他自己账户中的Q币续费，没想到Q币都没了，他立刻想到Q币被盗了。为了不再遇到这种问题，我们应该做好预防措施，将自己的Q币“封锁”起来。相似文献

6.

Q＆A用户交流

《个人电脑》2006,12(3):225-228

硬件 “失踪”的硬盘 Q前不久在一场事故中，我的笔记本电脑“毁”了，于是又买了一台新电脑。我把旧电脑上的硬盘拆了下来。并买了一个带USB接口的硬盘盒。将它装在里面．当作移动硬盘使用。相似文献

7.

基于自组织模糊RBF网络的连续空间Q学习

程玉虎王雪松易建强孙伟《信息与控制》2008,37(1):1-1

针对连续空间下的强化学习控制问题,提出了一种基于自组织模糊RBF网络的Q学习方法．网络的输入为状态,输出为连续动作及其Q值,从而实现了“连续状态—连续动作”的映射关系．首先将连续动作空间离散化为确定数目的离散动作,采用完全贪婪策略选取具有最大Q值的离散动作作为每条模糊规则的局部获胜动作．然后采用命令融合机制对获胜的离散动作按其效用值进行加权,得到实际作用于系统的连续动作．另外,为简化网络结构和提高学习速度,采用改进的RAN算法和梯度下降法分别对网络的结构和参数进行在线自适应调整．倒立摆平衡控制的仿真结果验证了所提Q学习方法的有效性．相似文献

8.

基于Q学习的多基站分簇拓扑控制算法

阎新芳冯岩王晓晓《传感技术学报》2016,29(4):578-582

为了解决无线传感器网络中单基站附近出现的“能量空洞”和网络时延过高等问题,引入多基站分簇拓扑控制算法。算法根据不同的场景来选择基站数目,结合图论和定向扩散中梯度的思想对网络进行分簇并运用Q学习算法对簇头节点进行周期性的学习训练,比较到达不同基站的不同路径上的Q值进行最优路径的选择。通过仿真分析表明,该算法相对于单基站分簇算法可以有效延长网络的生命周期。相似文献

9.

模拟Q＆A

《数码时代》2006,(4):138-139

Q：请问怎样调ePSxe的游戏速度？我玩的时候很快！A：如果想在EPSXE里限制游戏的帧数，可以用这个方法：运行EPSXE后，依次打开“设置”→“视频”→“设置”，便能够加入视频详细设置选项。把“使用帧数限制”这个选项勾上，然后在右面那里填上适合的帧数（—般是60-80帧）就可以了。相似文献

10.

悠扬灵动时尚精品：三星Q320笔记本

《现代计算机》2009,(4):32-32

三星Q320采用全新“简约之美”设计，13．4英寸机身搭配黑色钢琴烤漆，简约而不失雅韵。开启Q320，即刻印八眼帘的则是采用16：9比例、配备LED背光显示屏的“钛晶全景屏”。相似文献

11.

乐在手中把玩蓝魔Q25L

小白《计算机应用文摘》2009,(36):32-32

蓝魔音悦汇的数码播放器向来给人精巧时尚的感觉，近日笔者提前试用到其新品Q25L．颇觉不错。为什么是“提前试用”呢？这是因为Q25L是先在国外发售的，而到本文发稿时为止，它还没在国内上市。相似文献

12.

游戏Q＆A

《数码时代》2006,(9):136-137

Csebchl Q：我最近在玩《真三国4》，运行时居然跳出个“D3DX9_27.DLL”的玩意来，还有就是我最近上网经常受到网络攻击。怎么办？（我用卡巴斯基的杀毒工具）相似文献

13.

深度Q学习的二次主动采样方法

赵英男刘鹏赵巍唐降龙《自动化学报》2019,45(10):1870-1882

实现深度Q学习的一种方式是深度Q网络（Deep Q-networks,DQN）.经验回放方法利用经验池中的样本训练深度Q网络,构造经验池需要智能体与环境进行大量交互,这样会增加成本和风险.一种减少智能体与环境交互次数的有效方式是高效利用样本.样本所在序列的累积回报对深度Q网络训练有影响.累积回报大的序列中的样本相对于累积回报小的序列中的样本更能加速深度Q网络的收敛速度,并提升策略的质量.本文提出深度Q学习的二次主动采样方法.首先,根据序列累积回报的分布构造优先级对经验池中的序列进行采样.然后,在已采样的序列中根据样本的TD-error（Temporal-difference error）分布构造优先级对样本采样.随后用两次采样得到的样本训练深度Q网络.该方法从序列累积回报和TD-error两个方面选择样本,以达到加速深度Q网络收敛,提升策略质量的目的.在Atari平台上进行了验证.实验结果表明,用经过二次主动采样得到的样本训练深度Q网络取得了良好的效果. 相似文献

14.

如何保护好Q币Q点

GJZ 《电脑迷》2014,(12):73-73

正腾讯QQ作为被大家使用最多的即时通信工具,它推出的虚拟货币Q币可以用来支付QQ的QQ行号码、QQ会员服务以及其他增值服务。Q币可以通过购买QQ卡、电话充值、银行卡充值、网络充值、手机充值卡、一卡通充值卡等方式获得。作为虚拟货币,Q币用途广泛,因此被不法分子觊觎也就成了情理之中的事。如何保护好Q币Q点也成了拥有Q币的用户们比较关心的问题。相似文献

15.

游戏Q＆A

《数码时代》2006,(4):142-144

Q：3月这期数码加了个NDS游戏，不过听我同学说，NDS还可以模拟另一个游戏，好像是《生化危机》，是吗？A：暂时来说，神神我只是听过现时的某个NDS模拟器能够模拟“直感一笔”这个游戏，而且也不是非常流畅，算是勉强能够运行而已……至于你说到的能够模拟《生化危机》，这个更是听都未听过呢。可能是我孤陋寡闻吧…… 相似文献

16.

一种权重平均值的深度双Q网络方法

吴金金刘全陈松闫岩《计算机研究与发展》2020,57(3):576-589

深度强化学习算法的不稳定性和可变性对其性能有重要的影响.深度Q网络模型在处理需要感知高维输入数据的决策控制任务中性能良好.然而,深度Q网络存在着高估动作值使agent性能变差的问题.尽管深度双Q网络能够缓解高估带来的影响,但是仍然存在低估动作值的问题.在一些复杂的强化学习环境中,即使是很小的估计误差也会对学习到的策略产生很大影响.为了解决深度Q网络中高估动作值和深度双Q网络中低估动作值的问题,提出一种基于权重平均值的深度双Q网络方法(averaged weighted double deep Q-network, AWDDQN),该方法将带权重的双估计器整合到深度双Q网络中.为了进一步地减少目标值的估计误差,通过计算之前学习到的动作估计值的平均值来产生目标值,并且根据时间差分误差动态地确定平均动作值的数量.实验结果表明:AWDDQN方法可以有效减少估计偏差,并且能够提升agent在部分Atari 2600游戏中的表现. 相似文献

17.

游戏Q＆A

《数码时代》2005,(10):94-96

Q Kensou714 我装了《极品飞车：地下狂飚2》后，在进入游戏的时候，怎么经济在载入中卡住了？按什么链都没用！相似文献

18.

Q宠大乐斗霹雳宝贝养成计划

矮子《计算机应用文摘》2011,(3):20-22

小六最近迷恋上了QQ空间里的小游戏——Q宠大乐斗。可由于起步较晚，又没有什么游戏经验，老是被人家虐。有没有什么办法能让小六快速脱离菜鸟的称号，成为一只强力的“霹雳宝贝”呢？当然有，Q宠大乐斗和其他游戏一样，在充分地了解这个游戏的玩法之后，相似文献

19.

“开放竞争创新”共建公平平等的竞争秩序"3Q大战”尘埃落定后的深思

本刊编辑部《互联网天地》2014,(3):15-18

3年前。360退出扣扣保镖。“3Q大战”爆发。2014年2月24日。最高人民法院宣判，“3Q大战”落幕。最高院的判决围绕5个焦点展开，将对我国互联网行业监管起到一定的促进作用。相似文献

20.

自适应RBF网络Q学习控制 总被引：1，自引：0，他引：1

徐明亮须文波《控制与决策》2010,25(2):303-306

利用RBF网络逼近连续空间的Q值函数,实现连续空间的Q学习.RBF网络输入为状态-动作对,输出为该状态-动作对的Q值.状态由系统的状态转移特性确定,动作由优化网络输出得到的贪婪动作与服从高斯分布的噪声干扰动作两部分叠加而成.利用RNA算法和梯度下降法自适应调整网络的结构和参数.倒立摆平衡控制的实验结果验证了该方法的有效性. 相似文献