基于分布式架构的主题信息采集系统 |
| |
引用本文: | 马志强,张泽广,李昊甦,刘利民.基于分布式架构的主题信息采集系统[J].计算机工程与设计,2015(4):1094-1097,1121. |
| |
作者姓名: | 马志强 张泽广 李昊甦 刘利民 |
| |
作者单位: | 内蒙古工业大学信息工程学院 |
| |
基金项目: | 国家自然科学基金项目(61363052);内蒙古自治区高等学校科学研究基金项目(NJZY12052);内蒙古工业大学重点基金项目(ZD201118) |
| |
摘 要: | 针对主题信息采集系统存在的采集效率低和可扩展性差等问题,研究分布式采集系统架构,设计一种基于局域网的多节点服务器架构主题采集系统,解决了客户/服务器模式在采集网页数据增多时服务器控制端性能下降的问题,弥补了自治模式下网络间传递信息量增加导致数据延迟的缺陷。通过分别构建单节点服务器架构系统和基于局域网的多节点服务器架构系统进行实验,分析采集速度、平均采集速度和准确率等评价指标,分析结果表明,多节点服务器架构性能明显优于单节点服务器架构。
|
关 键 词: | 分布式采集系统 单节点服务器架构 多节点服务器架构 主题采集 准确率 |
本文献已被 CNKI 等数据库收录! |
|