首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
支持向量机在化学主题爬虫中的应用   总被引:3,自引:0,他引:3  
爬虫是搜索引擎的重要组成部分,它沿着网页中的超链接自动爬行,搜集各种资源。为了提高对特定主题资源的采集效率,文本分类技术被用来指导爬虫的爬行。本文把基于支持向量机的文本自动分类技术应用到化学主题爬虫中,通过SVM 分类器对爬行的网页进行打分,用于指导它爬行化学相关网页。通过与基于广度优先算法的非主题爬虫和基于关键词匹配算法的主题爬虫的比较,表明基于SVM分类器的主题爬虫能有效地提高针对化学Web资源的采集效率。  相似文献   

2.
随着互联网技术的飞速发展,网页数量急剧增加,搜索引擎的地位已经不可取代,成为人们使用Internet的入口。网络蜘蛛作为搜索引擎的信息来源是搜索引擎必不可少的组成部分。介绍网络蜘蛛设计中的关键技术。另外,随着用户个性化需求越来越强以及网页数量的急剧增加导致通用搜索引擎无法满足特定用户的需求,专业搜索引擎得到快速的发展。同时对于主题爬虫的研究也有很大的突破和进展。主题爬虫有别于通用爬虫,通用爬虫注重爬取的完整性,而主题爬虫强调网页与特定主题的相关性。同时对主题爬虫的研究现状进行介绍和总结。  相似文献   

3.
针对传统主题爬虫的不足, 提出一种基于主题相关概念和网页分块的主题爬虫。先通过主题分类树获取主题相关概念集合, 然后结合主题描述文档构建主题向量来描述主题; 下载网页后引入网页分块来穿越“灰色隧道”; 采用文本内容和链接结构相结合的策略计算候选链接优先级, 并在HITS算法的基础上提出了R-HITS算法计算链接结构对候选链接优先级的贡献。实验结果表明, 利用该方法实现的主题爬虫查准率达66%、信息量总和达53%, 在垂直搜索引擎和舆情分析应用方面有更好的搜索效果。  相似文献   

4.
基于多Agent系统的定题爬虫算法   总被引:2,自引:1,他引:1       下载免费PDF全文
徐照财  程显毅 《计算机工程》2008,34(16):204-206
定题爬虫的研究是定题搜索引擎的关键技术。该文提出一种基于多Agent系统的爬虫算法,采用本题语义主题关键词过滤的方法来抓取与主题相关的网页,利用本体库语义网络实现本体领域中同近义词的过滤。凭借HTML网页标记对关键字识别的不同权重和超链接锚文本对主题相关网页进行预测,通过黑板的通信机制实现多Agent交互。实验结果表明算法在抓取网页的查准率、查全率方面有一定的改善。  相似文献   

5.
主题网络爬虫是专业搜索引擎的重要组成部分,设计了一种基于本体的主题爬虫框架,使用领域本体来描述爬行主题,采用关键词提取技术确定网页主题,提出了基于领域本体的网页相关度计算的公式,实践证明基于本体的主题爬虫对网页提取的准确率大大提高。  相似文献   

6.
随着Internet的快速发展,越来越多的用户提出与主题或者领域相关的查询需求,而传统通用搜索引擎已经无法满足这一需求。为了克服传统通用搜索引擎的不足,研究者提出面向主题的爬虫。首先给出主题网络爬虫的定义,接着提出主题爬虫的三个关键技术:抓取目标、网页搜索策略和网页主题相关性算法,最后给出主题爬虫在今后的一些研究方向。  相似文献   

7.
为了提高搜索引擎对新闻检索的准确度,在研究垂直搜索引擎的设计思想和相关技术的基础上,利用Lucene搜索框架设计了新闻垂直搜索引擎.对网络爬虫进行了抓取规则的订制,使其只会抓取新闻相关的网页.采用卡方统计量进行文本特征提取,利用TF*IDF算法进行特征权值计算,利用支持向量机分类算法对新闻数据进行分类.实验结果表明,该新闻垂直搜索引擎可以精准地按类别搜索出新闻信息.  相似文献   

8.
定题搜索引擎是新一代搜索引擎的发展方向之一,而定题爬虫是定题搜索引擎的构建关键.本文提出了一个定题爬虫系统的设计框架,详细介绍了其实现的关键技术.针对传统主题过滤算法Hopfield网页分析算法的不足,提出了自主学习的网页分析算法,提高链接于不相关页面后的相关页面被搜索的机会,同时提出了简单高效的镜像页面检测算法,最后, 用原型系统FC测试表明系统有较好的性能.  相似文献   

9.
海量网页的存在及其量的急速增长使得通用搜索引擎难以为面向主题或领域的查询提供满意结果。本文研究的主题爬虫致力于收集主题相关信息,达到极大降低网页处理量的目的。它通过评价网页的主题相关度,并优先爬取相关度较高的网页。利用一种基于子空间的语义分析技术,并结合贝叶斯以及支持向量机,设计并实现了一个高效的主题爬虫。实验表明,此算法具有很好的准确性和高效性。  相似文献   

10.
刘明洁  李珅  梁毅 《软件》2020,(5):57-60
为了构建全面而且准确的法律文本纠错词库,本文提出基于网络爬虫的词库构建方法。此方法以常用爬虫为基础,扩展主题选取、网页排序等功能模块以提高爬虫的精准度和查全率。在得到数据后进行数据清洗以筛选有用词汇形成最终可使用的专业纠错词库。通过系统试运行验证了本爬虫设计方案的可行性,可以为相关词库的构建提供支持。  相似文献   

11.
根据航空发动机适航规定33.91条要求,发动机燃油系统部件需要开展高低温耐久试验。针对温度耐久试验系统设计开发了相应的测试系统。系统采用工控机和PLC作为核心控制,传感器将检测到的数据传到PLC,实现试验设备运行控制功能。上位机试验监视软件采用力控组态软件进行设计,对接收到的试验数据进行存储、显示和数据处理。针对温度控制延时的难点,采用了模糊PID算法实现了较好的控制效果。实际应用结果表明,该系统架构合理、使用方便、可靠性高,能够满足燃油系统部件温度耐久试验的要求。  相似文献   

12.
用闪耀光栅解调的光纤光栅测量振动系统   总被引:1,自引:0,他引:1  
介绍了用闪耀光栅解调的光纤光栅振动监测系统的设计及解调的原理。初步实验研究表明:在固定的频率下,检测振动振幅与振动信号特性吻合得很好,而且成功的将振动信号和温度信号分离。  相似文献   

13.
变压器的漏磁场强度随着变压器容量的增大而增大,漏磁场强度越大在变压器各结构中引起的漏磁损耗越大,导致变压器运行效率低下,进而影响变压器的正常运行。对35 kV变压器进行试验,将漏磁产生最大处的温度与油箱产生顶端处的温度进行了对比,试验得出当开风机时该处与油箱顶端处的最高温度差为8.7℃、当负荷降至1倍功率时温差为2.9℃,它们的实时温度曲线图与变压器的运行一致,产生了局部温升的现象。通过光纤Bragg光栅( FBG)检测温度的变化反映变压器漏磁的情况,从而实现了对变压器漏磁的实时在线监测。  相似文献   

14.
制作了接枝氨基的多壁碳纳米管薄膜传感器。研究了其对低体积分数甲醛气体的温度响应特性和膜厚与响应的关系。结果表明:当温度为22℃,薄膜的厚度为8.1μm时,这种薄膜传感器对低体积分数为20×lO-9的甲醛气体的响应可以达到2.9%,此体积分数低于国际卫生组织规定的标准。  相似文献   

15.
河冰现象是进行水资源开发利用时需要考虑的一个重要现象,冰层厚度检测是冰情状况检测的主要对象。研制了连接式螺旋体结构的光纤Bragg光栅(FBG)温度传感器。基于冰与水温度变点的机理,通过检测冰层与水的温度和传感器纵向分布阵列之间设置的间距得到冰层厚度。该FBG温度传感器使用导热系数较好的毛细紫铜管作为制作螺旋体结构材料。对不同厚度的冰在冰消过程中的厚度检测,实验结果表明:最大测量误差为12mm,最小测量误差为0mm。可通过调节U型管所在斜面和直通管所在平面角度改变各测点之间的间距。  相似文献   

16.
WO_3掺杂NiO的气敏性能研究   总被引:2,自引:1,他引:1  
用水热法制备出NiO纳米粉体,对其进行了WO3系列掺杂。利用XRD对产物晶相结构进行表征,测试了掺杂材料的气敏性能。结果表明:适量WO3的掺杂明显改善了NiO材料的气敏性能,其中,掺杂质量分数为6%的气敏元件性能最好,350℃时对Cl2的灵敏度可达到37.5,200℃时对H2S的灵敏度可达30.4。说明该元件在不同温度下对不同气体具有选择性,且该元件对H2S响应恢复快。  相似文献   

17.
Abstract

Antarctic research is often difficult to conduct because of the harsh environment, large extent of the continent and remoteness of many areas of interest. Satellite remote sensing is being investigated as a tool for aiding research throughout Antarctica. One application is the detection of katabatic winds and their temperature structure. Presented here is a katabatic event that occurred in July 1984 and was detected in the NOAA-7 polar orbiter thermal data. The study area is over the Transantarctic Mountains and Ross Ice Shelf. Results of the research and image processing analysis done for this case are provided. Intial results show that the satellite data can supply much information about the temperature change that occurs during this adiabatic process. Temperature increases were found to range from 20 to 30 deg k higher than the surrounding area temperatures for Byrd and Skelton glaciers. This was verified from ground information, collected by automatic weather stations, throughout the Ross Ice Shelf and east Antarctica.  相似文献   

18.
Results from the 1.4 GHz, S-194, microwave radiometer located on the SKYLAB satellite are presented. The objective of the investigation is to establish the degree to which quantitative measurements of sea surface temperature, salinity and related marine wind fields can be made using the S-194 radiometer. The analysis of the S-194 data demonstrates that it is possible to make measurements of the brightness temperature of open ocean areas with an RMS absolute accuracy of ±1.3 K over a wide range of environmental conditions. The S-194 is relatively insensitive to sea surface temperature changes and, even though measurements are available over a range in sea surface temperature of 30°C, no significant change in the measured antenna temperature was detected. However, S-194 is relatively sensitive to changes in surface salinity; and the analysis of data taken over the open ocean shows that salinity can be determined to an accuracy of ±2 parts per thousand. Further, it is shown that is it possible to accurately model complex regions such as lakes and bays, where a significant portion of the antenna beam is filled by land, and obtain excellent agreement between calculated and measured antenna temperatures. Open ocean measurements, obtained over the wide range in winds speeds of from 0 to 48 knots, show the antenna temperature to be weakly, but unambiguously, correlated with wind speed. The wind speed dependence determined, of 0.16 K/knot, indicates that surface wind speed can be measured to an accuracy of ±8 knots using the S-194.  相似文献   

19.
当前不少研究均得出煤层赋存原生CO气体的结论,但是未考虑钻孔施工过程中产生CO后被煤体吸附的可能。为探究西北地区易自燃煤层是否存在原生CO的问题,采用原始煤层原位钻孔探测方法进行原生CO探测试验。在未受采动影响的实体煤区域沿巷帮一字排开布置3个测试钻孔,钻孔密封后采用高纯N2置换密闭气室内气体,采用专用抽气泵抽取钻孔内气体,消除原位探测钻孔施工过程中煤体氧化产生CO对试验结果的影响。在分析煤层原生CO来源可能性及其涌出理论的基础上,探讨了密闭钻孔内气体浓度随时间变化特征,结果表明:密封后钻孔内O2和CO体积分数随密封时间的延长而迅速降低,12 d后O2体积分数稳定在2%以下;12 d后CO体积分数低于10-12,气相色谱仪未检测到CO气体;钻孔内气体主要为N2。由此推断,待测煤层中无原生CO气体。N2环境破煤试验和煤样常温恒温氧化试验结果表明,封孔初期检出的CO气体来源于钻孔施工破煤作业。  相似文献   

20.
针对Si基微结构气体传感器中Si基与敏感材料之间附着性较差的问题,提出在Si基与敏感材料之间引入纳米孔Al2 O3膜形成新型Si基微结构传感器,利用ANSYS分析软件对微结构进行热分析。采用薄膜工艺、光刻工艺、电化学阳极氧化工艺在Si衬底上制成Si基微结构,采用超声波的方法使聚苯胺敏感材料渗入纳米孔Al2 O3膜中制成气体传感器,并在室温下测试了传感器对氨气的检测特性。结果表明:将纳米孔Al2 O3膜移植到Si基上增加了敏感材料的附着性;传感器对响应时间约为40 s,恢复时间约为960 s,灵敏度随着氨气浓度的增加而增大,并且呈现出良好的线性关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号