首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   10篇
  国内免费   8篇
  完全免费   1篇
  自动化技术   19篇
  2015年   1篇
  2013年   2篇
  2012年   3篇
  2011年   2篇
  2010年   7篇
  2009年   1篇
  2008年   1篇
  2007年   1篇
  2004年   1篇
排序方式: 共有19条查询结果,搜索用时 46 毫秒
1.
面向垂直搜索引擎的Web站点划分方案   总被引:1,自引:1,他引:1       下载免费PDF全文
分析传统搜索引擎分配任务的方式及存在的问题,根据垂直搜索引擎的特点,提出一种比传统方法粒度更细的任务分配方式——网站划分。该分配方式将较大规模的网站切分为若干较小规模的子集,并将子集交给若干爬虫节点并行抓取,以加快爬虫系统的整体获取速率,作为对传统方法的有效优化。将网站划分算法应用于样本数据集,验证其有效性。  相似文献
2.
许 笑  张伟哲  张宏莉  方滨兴 《软件学报》2010,21(4):1067-1082
分析了广域网分布式Web 爬虫相对于局域网爬虫的诸多优势,提出了广域网分布式Web 爬虫的3 个核心 问题:Web 划分、Agent 协同和Agent 部署.围绕这3 个问题,对目前学术界和商业界出现的多种实现方案和策略进 行了全面的综述,深入讨论了研究中遇到的问题与挑战,并论述了广域网分布式Web 爬虫的评价模型.最后,对未来 的研究方向进行了总结.  相似文献
3.
张伟哲  张宏莉  张元竞 《软件学报》2010,21(Z1):238-250
针对基于MPI 的并行作业性能预测问题,鉴于历史预测与建模分析方法在异构网络计算环境中性能预测的局限,提出了基于判例构造的并行作业性能预测方法.在MPI 库PMPI 接口中插入封套函数,获取通信日志,并设计了日志规整和合并算法.将最核心的日志循环收缩问题,转化为字符串循环子串收缩问题,提出了一种基于后缀数组算法,在理论和实际的性能方面均优于已有算法;判例程序自动构建阶段,解决了计算时间与通信时间等比例缩放问题,设计了自动构建可执行判例程序的方法.同构与异构机群环境实验结果表明,判例预测方法能够比较准确地预估计算作业的运行时间,对于同构机群误差不超过3%,异构机群误差不超过10%,与同类算法相比,具有较好的综合性能.  相似文献
4.
许 笑  张伟哲  张宏莉  方滨兴 《软件学报》2010,21(5):1067-1082
分析了广域网分布式Web爬虫相对于局域网爬虫的诸多优势,提出了广域网分布式Web爬虫的3个核心问题:Web划分、Agent协同和Agent部署.围绕这3个问题,对目前学术界和商业界出现的多种实现方案和策略进行了全面的综述,深入讨论了研究中遇到的问题与挑战,并论述了广域网分布式Web爬虫的评价模型.最后,对未来的研究方向进行了总结.  相似文献
5.
6.
网络舆情突发事件的监测与分析具有重要的理论意义与实际应用价值。为保证舆情分析的准确性和及时性,基于现有的舆情挖掘和分析理论进行改进,从Web、Blog和BBS等多个通道获取舆情信息;采用多任务技术提高网络舆情突发事件信息获取速度;采用目标可定制技术规避海量信息处理的压力;舆情敏感信息扩散跟踪可以及时发现突发事件的爆发源头。  相似文献
7.
虚拟化技术为云计算基础设施资源的动态部署、安全隔离提供了重要保证.从过度占用内存的虚拟机中回收内存,提供给内存紧缺的虚拟机使用,优化多虚拟机间的内存分布是内存虚拟化中的挑战性问题.文中引入了自发调节和全局调节协作的多虚拟机内存管理架构.通过定义内存资源充裕状态和内存资源紧缺状态,提出了自发调节和全局调节之间协作的算法.处于内存资源充裕状态时,各虚拟机可采用自发调节策略平衡内存资源.处于内存资源紧缺状态时,基于空闲内存价格的全局调节策略平衡内存资源.实验结果表明,针对计算密集型与存储密集型负载,该框架与算法均能很好地提高服务能力,同时具有较高的可扩展性与较低的性能惩罚.  相似文献
8.
网络论坛是中国网民一个重要的意见传播渠道,论坛舆论领袖对网络舆论导向起着至关重要的作用,影响力发现为越来越多的研究人员所关注。针对传统的在线论坛中有影响力主题计算方法的不足,本文将论坛中帖子间的回复关系映射为发帖者之间的关联关系,构造出一个社群网络,提出高权重词集的概念,基于此,通过计算词语在回帖传播链上的影响力,设计并实现了论坛中成员的影响力计算模型。通过实验验证了该模型在时间、空间复杂性上的优越性,为进一步研究复杂网络中的人物行为奠定了基础。  相似文献
9.
针对互联网论坛中舆论领袖筛选问题,提出了基于发帖网民的语料和基于网民的网络行为统计属性特征的互补性网络舆论领袖筛选模型.通过深入分析基于在线社区内容的"影响力扩散模型",提出了基于发帖网民语料的"阶梯式"评价法的全新算法.对基于统计属性特征评价方法的属性进行了重新定义,选取了更为合理的网络统计数据,增加了互补性的属性值,使评价方法更趋完善.通过与专家法人工筛选出的舆论领袖相比较,该模型筛选出舆论领袖的成功率在85%以上,模型具有较强的实用性和重要应用价值.  相似文献
10.
随着网络论坛、博客、微博的发展,引出社会网络中的用户排序问题。将在线网络论坛中用户映射为节点,用户评论过程中形成的回复关系映射为有向关联图,其节点度符合幂律分布。且论坛中用户的主题发布行为和回复关系符合Pagerank算法的互增强和随机游走特性,因此选用Pagerank算法排序用户影响力。该文提出的研究问题:如何提高用户排序应用中数据的存储和运行效率。天涯网络论坛中80%以上用户入度为0,据此,根据入度是否为0划分为两个集合,对入度为0集合按出度构造链接表,设计了基于集合划分的高效排序算法SD-Rank。SD-Rank时空复杂性为O(V′),V′为入度非0节点集。对天涯网络论坛真实用户数据的实验结果表明:SD-Rank算法时空复杂性优于Pagerank算法。  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号