首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   8篇
  完全免费   5篇
  自动化技术   13篇
  2018年   1篇
  2017年   3篇
  2016年   1篇
  2015年   2篇
  2014年   5篇
  2013年   1篇
排序方式: 共有13条查询结果,搜索用时 46 毫秒
1.
大数据系统和分析技术综述   总被引:6,自引:0,他引:6       下载免费PDF全文
首先根据处理形式的不同,介绍了不同形式数据的特征和各自的典型应用场景以及相应的代表性处理系统,总结了大数据处理系统的三大发展趋势;随后,对系统支撑下的大数据分析技术和应用(包括深度学习、知识计算、社会计算与可视化等)进行了简要综述,总结了各种技术在大数据分析理解过程中的关键作用;最后梳理了大数据处理和分析面临的数据复杂性、计算复杂性和系统复杂性挑战,并逐一提出了可能的应对之策.  相似文献
2.
网络大数据:现状与展望   总被引:6,自引:0,他引:6  
网络大数据是指“人、机、物”三元世界在网络空间(Cyberspace)中交互、融合所产生并在互联网上可获得的大数据.网络大数据的规模和复杂度的增长超出了硬件能力增长的摩尔定律,给现有的IT架构以及机器处理和计算能力带来了极大挑战.同时,也为人们深度挖掘和充分利用网络大数据的大价值带来了巨大机遇.因此,迫切需要探讨大数据的科学问题,发现网络大数据的共性规律,研究网络大数据定性、定量分析的基础理论与基本方法.文中分析了网络大数据的复杂性、不确定性和涌现性,总结了网络空间感知与数据表示、网络大数据存储与管理体系、网络大数据挖掘和社会计算以及网络数据平台系统与应用等方面的主要问题与研究现状,并对大数据科学、数据计算需要的新模式与新范式、新型的IT基础架构和数据的安全与隐私等方面的发展趋势进行了展望.  相似文献
3.
网络大数据是指"人、机、物"三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.网络大数据背后蕴含着丰富的、复杂关联的知识.建立面向开放网络的知识库是获取网络大数据中的丰富知识的有效手段.对当前国内外主要的开放网络库进行了比较,分析了相应的构建方法、多源知识的融合以及知识库的更新等关键技术.进一步从用户意图理解、查询扩展、语义问答、线索挖据、关系推理以及关系和属性预测等方面出发,总结了基于开放网络知识库的信息检索、数据挖掘与系统应用的研究现状和主要问题.最后,对开放网络知识库的发展趋势和面临的主要挑战进行了展望.  相似文献
4.
该文研究属性依赖情感知识学习.首先提出了一个新颖的话题模型,属性观点联合模型(Joint Aspect/Opinion model,JAO),来同时抽取评论实体属性及属性相关观点词信息.在此基础上,对于各个属性,构造属性依赖的词关系图,并在该图上应用马尔科夫随机行走过程来计算观点词到少量褒、贬种子词的游走时间(Hitting Time),进而估计这些词的属性依赖的情感极性分值.在餐馆点评数据上的实验表明所提出的方法能有效抽取属性相关观点词,同时有效估计其属性依赖的情感极性分值.  相似文献
5.
信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升.  相似文献
6.
近些年,P2P点播系统(P2P-Vo D)受到广泛关注,其大多研究工作基于理论性的传统假设,这些假设在真实的系统中是如何表现的不得而知。因此,在真实P2P-Vo D系统中对传统假设进行全面的测量和验证就显得十分迫切。对实际运行的P2P-Vo D系统Cool Fish进行了大量的测量与分析,发现了一些不同于以往假设的结果:节点加入不是简单地服从泊松分布;观看时间和影片流行度不呈严格的正相关性;跳转频率和影片流行度不呈负相关。最后对这些结果进行了深入的分析和讨论。  相似文献
7.
关注非结构化文本中命名实体属性值的抽取问题.当前主流有监督属性值抽取方法仅使用局部特征,抽取效果有限,开展了利用文本全局特征改善属性值抽取的研究.通过适用于中文属性值抽取的全局特征,用局部特征以外的有价值信息提高抽取效果.据此,提出结合全局特征的感知机学习算法,该算法能够方便地融合文本全局特征,并将全局特征和局部特征统一结合到模型学习过程中,使模型具有更好的特征表示能力.实验结果表明,所提出方法的整体抽取效果高于仅使用局部特征的CRF模型和平均感知机模型.该方法适用于开放领域的属性值获取,具有较好的泛化能力.  相似文献
8.
大数据时代,数据间的高相关性为大数据带来了重要价值,"图"这一抽象数据结构能够很好地表示数据间的关系.复杂图数据具有数据规模大、建模需求多、关系查询复杂等特点,为图存储系统的构建带来挑战.提出了一种支持时间演化和数据溯源的图数据模型,形式化定义了数据结构、数据操作和数据完整性约束,为大规模图数据存储系统的实现奠定了理论基础;实现了一个支持复杂数据查询的图存储系统,为分析挖掘图数据的巨大价值提供了底层基础设施技术支撑.通过实验对系统的存储、入库、查询等能力进行了效果评估,结果表明所提方法有效可行.  相似文献
9.
笱程成  秦宇君  田甜  伍大勇  刘悦  程学旗 《软件学报》2017,28(11):3030-3042
社交网络中,消息的爆发预测属于社交网络流行动态分析的范畴,是社会计算领域的研究热点之一.通过利用基于深度循环神经网络对社交消息的传播过程进行建模,提出了SMOP(social messages outbreak prediction model based on recurrent neural network)模型.与传统的基于机器学习的模型相比,SMOP直接对消息转发的到达过程进行建模,避免了传统方法中繁琐的特征工程;与基于点随机过程的模型相比,SMOP可以自动学习消息传播过程的速率函数,不需要手动定义消息传播速率的特征函数,具有较强的数据场景适应性.另外,SMOP采用了时间向量和用户向量的输入表示方法,将时间的周期性和用户的兴趣偏好建模到传播过程之中,提升了SMOP的预测效果.在Twitter和新浪微博数据集上的实验结果均表明,SMOP具有优良的数据适应能力,可以在消息传播的早期(0.5h),以较高的F1值预测某条社交消息是否爆发,验证了模型的有效性.  相似文献
10.
正近年来,以社交网络和社会媒体为代表的在线社会关系网络正深刻改变着人们制造、传播和接收信息的方式.人的互联成为信息互联的载体和信息传播的媒介,个体间的强交互性使得信息传播的网络效应越发凸显.在线社会关系网络汇聚了大量的用户关系、行为等可感知和可计算的人类社会的数字足迹,为社会计算  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号