期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

罗成程耀东胡庆宝李海波《核电子学与探测技术》2014,(3)

大数据时代如何精确而有效地抓取用户所需要的数据成为了一个至关重要的问题,提出一种可配置的聚焦网络爬虫框架,基于配置文件的设置,构建一个数据采集精确、可控性强的聚焦网络爬虫。在此基础上改进聚焦爬虫工作流程,实现Deep Web表单自动提交以及Deep Web数据抓取。实验通过高能物理研究所网站与手机腾讯微博的数据爬取以及爬虫在高能物理研究所大数据平台上的实际运行效果说明了爬虫设计的有效性与实用性。相似文献

2.

基于随机森林的高能物理数据放置策略

下载免费PDF全文

程振京程耀东陈刚汪璐李海波胡庆宝《计算机工程与应用》2020,56(21):60-64

随着LHAASO高海拔宇宙线等高能物理实验规模的不断扩大,每年需要存储PB级的海量物理数据。高能物理海量存储系统一般采用随机的数据放置策略,没有考虑数据访问场景和服务器节点、存储设备的差异性。针对以上问题,提出一种异构存储环境下基于随机森林算法的数据放置策略,根据存储设备性能差异划分快慢存储池,同时对后期文件的读写访问场景进行预测和识别,综合考虑当前设备负载为数据找到最佳的放置位置。使用真实物理实验数据验证了算法的有效性。相似文献

3.

基于众包的社交网络数据采集模型设计与实现 总被引：1，自引：0，他引：1

高梦超胡庆宝程耀东周旭李海波杜然《计算机工程》2015,(4)

社交网络数据信息量大、主题性强,具有巨大的数据挖掘价值,是互联网大数据的重要组成部分。针对传统搜索引擎无法利用关键字检索技术直接索引社交网络平台信息的现状,基于众包模式,采用C/S架构,设计社交网络数据采集模型,包含服务端、客户端、存储系统与主题Deep Web爬虫系统4个模块。通过主题Deep Web爬虫的分布式机器节点自动向服务器请求爬虫任务并上传爬取数据,利用Hadoop分布式文件系统对爬取数据进行快速处理并存储结果数据。实验结果表明,主题Deep Web爬虫系统配置简单,支持功能扩展和目标信息直接获取,数据采集模型具有较快的数据获取速度及较高的信息检索效率。相似文献

4.

面向高能物理分级存储的文件访问热度预测

程振京汪璐程耀东陈刚胡庆宝李海波《计算机工程》2021,47(2):126-132

高能物理计算是典型的数据密集型计算,其主要采用基于文件的分级存储方案,根据访问热度的不同将数据存储于不同性能的存储设备上,然而当前数据热度预测采用基于人工经验的启发式算法,准确率较低。提出一种借助长短期记忆网络预测文件未来访问热度的方法,包括网络结构设计、训练和预测算法等。该方法通过划分动态时间窗口构造文件访问特征的时序序列,预测不同数据的访问趋势。在LHAASO高能物理实验数据集上的实验结果表明,与SVM、MLP等算法相比,该方法预测准确率提升了30%左右,具有更强的适用性。相似文献

5.

基于H.264/SVC的P2P内容分发系统设计与实现 总被引：1，自引：1，他引：0

胡庆宝周旭白帆黄威唐朝伟宗伟《电子技术应用》2012,(7):120-122

通过对H.264/SVC和互联网P2P技术的研究,提出了复杂网络环境下的H.264/SVC视频流分发策略,设计了基于H.264/SVC视频流的P2P内容分发系统。该系统结合了H.264/SVC码流可伸缩和P2P易扩展的优点,实现了复杂网络环境下自适应视频码流传输,解决了异构终端间视频资源共享问题。相似文献

6.

Kubernetes异构资源细粒度调度策略的设计与实现

刘志彬黄秋兰胡庆宝程耀东胡誉田浩来《计算机工程》2023,49(2):31-36+45

在异构资源环境中高效利用计算资源是提升任务效率和集群利用率的关键。Kuberentes作为容器编排领域的首选方案,在异构资源调度场景下调度器缺少GPU细粒度信息无法满足用户自定义需求,并且CPU/GPU节点混合部署下调度器无法感知异构资源从而导致资源竞争。综合考虑异构资源在节点上的分布及其硬件状态,提出一种基于Kubernetes的CPU/GPU异构资源细粒度调度策略。利用设备插件机制收集每个节点上GPU的详细信息,并将GPU资源指标提交给调度算法。在原有CPU和内存过滤算法的基础上,增加自定义GPU信息的过滤,从而筛选出符合用户细粒度需求的节点。针对CPU/GPU节点混合部署的情况,改进调度器的打分算法,动态感知应用类型,对CPU和GPU应用分别采用负载均衡算法和最小最合适算法,保证异构资源调度策略对不同类型应用的正确调度,并且在CPU资源不足的情况下充分利用GPU节点的碎片资源。通过对GPU细粒度调度和CPU/GPU节点混合部署情况下的调度效果进行实验验证,结果表明该策略能够有效进行GPU调度并且避免资源竞争。相似文献

7.

基于 Elasticsearch 的实时集群日志采集和分析系统实现

胡庆宝姜晓巍石京燕程耀东梁翠萍《数据与计算发展前沿》2016,7(3):13-18

传统日志工具采集时间长、处理效率低下,无法支持大规模集群日志采集和分析需求。我们从实际需求出发,结合Flume和Elasticsearch设计实现了集群日志的实时采集和快速查询分析系统。通过预设日志规则库,实时统计并展示集群系统的运行状态,提供预警信息。相似文献

8.

粘滞阻尼器在高烈度区框架结构中的性能分析

蔡祎陈颖辉欧明喜胡庆宝《建筑技术》2023,(21):2579-2582

某幼儿园–综合楼项目，采用了粘滞阻尼器进行结构减震设计。借助有限元软件SAP2000建立原始结构模型，并和盈建科模型进行对比校核，模型精度满足要求。挑选地震波输入模型，采用时程分析法加以研究，分析其在小震弹性和大震下弹塑性下结构的抗震消能情况。结果表明：结构在安装粘滞阻尼器后，各项抗震指标均在规范要求范围之内，地震能量消散情况较好，结构抗震性能有效提升，增强了结构安全性。相似文献