期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	363篇
免费	49篇
国内免费	57篇

专业分类

电工技术	5篇
综合类	22篇
化学工业	4篇
金属工艺	9篇
机械仪表	78篇
建筑科学	13篇
矿业工程	49篇
能源动力	4篇
轻工业	3篇
水利工程	1篇
石油天然气	2篇
武器工业	5篇
无线电	32篇
一般工业技术	12篇
冶金工业	4篇
自动化技术	226篇

出版年

2024年	2篇
2023年	2篇
2022年	15篇
2021年	18篇
2020年	14篇
2019年	13篇
2018年	13篇
2017年	10篇
2016年	13篇
2015年	22篇
2014年	53篇
2013年	31篇
2012年	63篇
2011年	42篇
2010年	45篇
2009年	29篇
2008年	26篇
2007年	14篇
2006年	11篇
2005年	10篇
2004年	6篇
2003年	3篇
2002年	4篇
2001年	1篇
2000年	2篇
1998年	1篇
1997年	1篇
1996年	3篇
1995年	2篇

排序方式： 共有469条查询结果，搜索用时 15 毫秒

[首页] « 上一页 [9] [10] [11] [12] [13] 14 [15] [16] [17] [18] [19] 下一页 » 末页»

131.

Improving the performance of focused web crawlers

Sotiris Euripides G.M. Evangelos 《Data & Knowledge Engineering》2009,68(10):1001-1013

This work addresses issues related to the design and implementation of focused crawlers. Several variants of state-of-the-art crawlers relying on web page content and link information for estimating the relevance of web pages to a given topic are proposed. Particular emphasis is given to crawlers capable of learning not only the content of relevant pages (as classic crawlers do) but also paths leading to relevant pages. A novel learning crawler inspired by a previously proposed Hidden Markov Model (HMM) crawler is described as well. The crawlers have been implemented using the same baseline implementation (only the priority assignment function differs in each crawler) providing an unbiased evaluation framework for a comparative analysis of their performance. All crawlers achieve their maximum performance when a combination of web page content and (link) anchor text is used for assigning download priorities to web pages. Furthermore, the new HMM crawler improved the performance of the original HMM crawler and also outperforms classic focused crawlers in searching for specialized topics. 相似文献

132.

分布式多主题网络爬虫系统的研究与实现 总被引：1，自引：1，他引：0

下载免费PDF全文

白鹤汤迪斌王劲林《计算机工程》2009,35(19):13-16,1

提出一种基于数据抽取器的分布式爬虫架构。该架构采用基于分类标注的多主题策略,解决同一爬虫系统内多主题自适应兼容的问题。介绍二级加权任务分割算法,解决基于目标导向、负载均衡的URL分配问题,增强系统可扩展性。给出基于Trie树的URL存储策略的改进方法,可以高效地支持URL查询、插入和重复性检测。相似文献

133.

基于本体的Deep Web数据源聚焦搜索系统研究

张素智李丽娜《微计算机信息》2010,(6)

Deep Web中包含内容丰富、主题专一的高质量信息,为了自动地采集和集成这些数据,数据源的发现是关键。本文设计了一种基于本体的DeepWeb数据源聚焦搜索系统,给出了核心搜索算法。并通过实验,表明该方法是可行有效的。相似文献

134.

基于云计算的定向搜索监控研究

屈振新朱文昌《计算机工程与科学》2013,35(1):82-87

传统的搜索引擎不能代替用户实行实时监控,为了解决这个问题,提出了定向搜索监控技术,用户可以根据自己的需求定制任务,包括指定搜索范围和搜索主题,系统按用户定义周期监控,并将结果及时主动地反馈给用户。以Google云平台Google App Engine作为开发平台,利用其提供的多项云服务,有效地解决了计划任务管理、多任务触发以及高并发等问题。重写了通用网络爬虫,通过算法改进提出了定向网络爬虫模型,定向网络爬虫与云端强大的服务器相结合,极大地缩短了爬行时间,提高了搜索监控效率。云平台和搜索监控技术的结合是平台即服务思想的一次成功实验。相似文献

135.

一个面向实时网页分类的主题特征提取算法

彭浩王雅琳《计算机与现代化》2008,(7):8-11

网页实时分类是聚焦爬虫需要解决的重要问题,现有主题特征提取方法多数是面向离线分类的,性能达不到应用要求。本文首先扩展了标签树表示模型DocView的节点类型,且将其作为加权的重要因素,然后提出一个面向实时网页分类的Web文本和文本集主题特征提取算法。实验结果表明,算法的准确率提高了31％,主题偏移度降低了1倍多,能够满足应用要求。同时,还提出了一个新的主题特征提取性能评价模型。相似文献

136.

基于主题相似度指导网络蜘蛛穿越隧道的爬行算法 总被引：1，自引：0，他引：1

陈小海周娅《计算机工程与科学》2009,31(10)

隧道穿越一直是主题网络蜘蛛爬行研究的难点,本文在分析了网页主题特征和普通隧道技术爬行算法缺点的基础上,提出了使用主题相似度指导网络蜘蛛穿越隧道的爬行算法,并用朴素贝叶斯分类器方法提高主题相似度计算精度。实验表明,本文提出的隧道穿越技术在查准率和查全率方面都比普通隧道技术有很大提高。相似文献

137.

黄河防汛液压履带式挖掘机加油装置的设计与应用

郑兰霞赵信峰李冰陈艳艳《水利水电技术》2014,45(7):117

在充分认识传统防汛挖掘机加油方法的基础上,对黄河防汛液压履带式挖掘机加油装置进行了原理分析和整体设计,并且对方案优化进行了对比应用研究。此加油装置可节省加油时间,提高加油效率,能保证挖掘机加油的清洁。相似文献

138.

一种基于语义分析的主题爬虫算法

下载免费PDF全文

蒋宗礼田晓燕赵旭《计算机工程与科学》2010,32(9):145-147

海量网页的存在及其量的急速增长使得通用搜索引擎难以为面向主题或领域的查询提供满意结果。本文研究的主题爬虫致力于收集主题相关信息,达到极大降低网页处理量的目的。它通过评价网页的主题相关度,并优先爬取相关度较高的网页。利用一种基于子空间的语义分析技术,并结合贝叶斯以及支持向量机,设计并实现了一个高效的主题爬虫。实验表明,此算法具有很好的准确性和高效性。相似文献

139.

面向垂直搜索引擎的Web站点划分方案 总被引：2，自引：1，他引：1

下载免费PDF全文

李学凯许笑孙春奇张伟哲李斌《计算机工程》2010,36(8):275-277

分析传统搜索引擎分配任务的方式及存在的问题,根据垂直搜索引擎的特点,提出一种比传统方法粒度更细的任务分配方式——网站划分。该分配方式将较大规模的网站切分为若干较小规模的子集,并将子集交给若干爬虫节点并行抓取,以加快爬虫系统的整体获取速率,作为对传统方法的有效优化。将网站划分算法应用于样本数据集,验证其有效性。相似文献

140.

一种多源统一爬虫框架的设计与实现

潘洪涛《软件工程》2021,(4)

面向深层网数据的爬虫技术与反爬虫技术之间的对抗随着网站技术、大数据、异步传输等技术的发展而呈现此消彼长的趋势。综合对比当前主流的爬虫和反爬虫技术,针对高效开发、快速爬取的需求,MUCrawler(多源统一爬虫框架)被设计成一种可以面向多个网站数据源,以统一的接口形式提供爬虫开发的Python框架。测试结果显示,该框架不但能够突破不同的反爬虫技术获取网站数据,在开发效率、鲁棒性和爬取效率等方面也体现出较好的运行效果。相似文献

[首页] « 上一页 [9] [10] [11] [12] [13] 14 [15] [16] [17] [18] [19] 下一页 » 末页»