排序方式: 共有25条查询结果,搜索用时 15 毫秒
11.
基于众包的社交网络数据采集模型设计与实现 总被引:1,自引:0,他引:1
社交网络数据信息量大、主题性强,具有巨大的数据挖掘价值,是互联网大数据的重要组成部分。针对传统搜索引擎无法利用关键字检索技术直接索引社交网络平台信息的现状,基于众包模式,采用C/S架构,设计社交网络数据采集模型,包含服务端、客户端、存储系统与主题Deep Web爬虫系统4个模块。通过主题Deep Web爬虫的分布式机器节点自动向服务器请求爬虫任务并上传爬取数据,利用Hadoop分布式文件系统对爬取数据进行快速处理并存储结果数据。实验结果表明,主题Deep Web爬虫系统配置简单,支持功能扩展和目标信息直接获取,数据采集模型具有较快的数据获取速度及较高的信息检索效率。 相似文献
12.
为解决高能物理海量存储系统由于存储规模不断扩大所面临的问题,设计一种分布式元数据管理系统,包括元数据管理、元数据服务、缓存服务以及监控信息采集4个部分,在此基础上提出自适应目录子树划分算法,以目录为粒度进行元数据划分,根据集群负载情况调整目录子树,实现元数据信息在元数据集群中的合理存储和分布。实验结果证明,该算法能提高元数据的访问和检索性能,提供可扩展及动态负载均衡的元数据服务,以保证该元数据管理系统的可用性、扩展性及I/O性能不会因存储规模扩大而受到影响,满足高能物理实验日益增长的存储需求。 相似文献
13.
探讨了布袋除尘器超低排放改造的主要措施,并基于钢铁企业的矿焦槽除尘超低排放改造工程,介绍了四种改造方案:串联除尘箱体、并联除尘器、加高除尘器、改变滤袋形状。分析了各种改造方案的利弊,推荐在扩容比例较高时优先选择改用褶皱滤袋的方案,并简要阐述了超低排放改造的效益。 相似文献
14.
国外的朋友给我发来苹果电脑CEO史蒂夫·乔布斯在今年6月12日斯坦福大学毕业典礼上的演讲,读后令人不禁动容。其文并无华丽之色。也无英文演讲中惯用的排比,现将全文译出。标题为译者所加.刊登时有删节。 相似文献
15.
我公司作为石家庄市唯一的气源厂,在城市居民煤气及工业煤气供应方面发挥了巨大的作用。随着煤气外送供需矛盾的日益突出,致使煤气大量放散,日放散约为10~15万m3,直接造成资源的浪费和对环境的污染。为解决这个问题,我们经过考察论证,采用3套QDR20型燃气轮机热电联供机组进行煤气发电,设计装机容量为2000kW×3,蒸汽产量为19.5t/h,该装置于2003年建成投运以来取得了较好的效益,现将装置和运行情况作一介绍。1煤气发电工艺过程1.1燃气轮机基本工作原理我公司煤气发电工艺的3套燃气轮机是由涡桨6型航空发动机改造而成,在原来燃油型燃气轮机… 相似文献
16.
目的:探讨医院信息系统安全现状与规划。方法:分析在医院工作环境里信息安全面临实际问题。结果:医院信息系统安全面临诸多有待解决的问题。结论:发现现有系统的缺陷并提出有效解决方案,规划应具有体系性和原则性。 相似文献
17.
18.
针对桌面网格中出现的应用部署难、作业结果差异大、系统可扩展性差等问题,基于虚拟化技术提出一种桌面网格架构。利用虚化技术的隔离性和封装性,通过面向应用的作业调度策略以及有限生命周期的虚拟机控制方式,实现一个易于扩展且易于部署的桌面网格架构。分析及测试结果表明,该架构适用于大规模应用场景,架构中所采用的面向应用的调度策略以及虚拟机控制方式是有效可行的。 相似文献
19.
随着微博的日趋流行,新浪微博已成为公众获取和传播信息的重要平台之一,针对微博数据的话题挖掘也成为当前的研究热点。提出一个面向大规模微博数据的话题挖掘方法。首先对大规模微博数据进行分析,基于Bloom Filter算法对数据进行去重处理,针对微博的特有结构,对文本进行预处理,提出改进的LDA主题模型Social Network LDA(SNLDA),采用吉布斯采样法进行模型推导,挖掘出微博话题。实验结果表明,方法能有效地从大规模微博数据中挖掘出话题信息。 相似文献
20.
江门中微子实验(JUNO)是以测定中微子质量顺序、精确测量中微子混合参数为主要目的的一项物理科学前沿研究实验,其实验规模庞大,数据处理流程繁杂,需借助统一高效的离线计算平台对数据进行分析处理。为此,利用Docker容器分层的镜像技术将JUNO实验所需的环境依赖库打包在镜像文件中,为其制定针对不同操作系统作业的容器镜像,并将不同JUNO容器作业提交至作业调度器上运行,以实现资源共享。对物理机、容器、虚拟机3种平台的CPU性能、I/O性能及JUNO作业的实际运行效果进行对比测试,结果表明,Docker容器能够胜任JUNO离线数据处理,相比虚拟机具有更小的性能损耗。 相似文献