首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
Internet化学信息的系统挖掘工具   总被引:1,自引:0,他引:1  
本文简要介绍中国科学院过程工程所(原化工冶金所)在Internet化学化工信息资源系统挖掘方面正在形成的一个较完整的化学专业信息获取平台,包括:(1)国家科学数字图书馆化学学科信息门户ChIN;(2)网络化学化工专业搜索引擎ChemEngine;(3)化学深层网挖掘工具ChemDB Portal.其中ChIN已经成熟,是国内权威、中国唯一被国际承认的网络化学资源导航系统;ChemEngine是通用搜索引擎技术与化学相关的领域知识相结合形成的化学化工专业搜索引擎,初步测试优于国际具有类似功能的系统:德国的ChemGuide和美国的Chemlndustry.ChemDB Portal则是正在进行的、基于XML对化学深层网数据进行提取和索引方法的研究,这一方法尚未见报道.这些工具可为检索网络化学相关信息提供更方便、更好的专业化解决方案.  相似文献   

2.
深层网技术是获取隐藏在以表单为特征的网络数据库检索入口后的数据页面的提取技术,解决了通用搜索引擎不能有效索引深层网网页的问题。专利数据是一类重要的深层网数据资源,对其进行提取、挖掘具有重要意义。本文利用深层网技术开发了一个专利检索系统,实现了对中国和美国专利数据的本地检索、提取和下载,以及针对中国专利的法律状态检索。该软件支持专利的批量下载及文件管理,并根据中国和美国专利显示为多个单页TIFF格式图片不利于本地管理和浏览的特点,开发了实用性较强的TIFF格式图片多页合并和通用PDF格式转换功能。该专利检索系统采用面向用户的界面设计和功能开发,具有简单、易用的特点。  相似文献   

3.
XML技术在化学深层网数据提取中的应用   总被引:1,自引:1,他引:0  
Internet上的化学数据库是宝贵的化学信息资源,如何有效地利用这些数据是化学深层网所要解决的问题。本文总结了化学深层网的特点,基于XML技术实现从数据库检索返回的半结构化HTML页面中提取数据的目标,使之成为可供程序直接调用做进一步计算的数据。在数据提取过程中,先采用JTidy规范化HTML,得到格式上完整、内容无误的XHTML文档,利用包含着XPath路径语言的XSLT数据转换模板实现数据转换和提取。其中XPath表达式的优劣决定了XSLT数据转换模板能否长久有效地提取化学数据,文中着重介绍了如何编辑健壮的XPath表达式,强调了XPath表达式应利用内容和属性特征实现对源树中数据的定位,并尽可能地降低表达式之间的耦合度,前瞻性地预测化学站点可能出现的变化并在XSLT数据转换模板中采取相应的措施以提高表达式的长期有效性。为创建化学深层网数据提取的XSLT数据提取模板提供方法指导。  相似文献   

4.
随着Internet的飞速发展和动态网页技术的持续应用,深层网中含有越来越多宝贵的资源,如何让系统自动提取这些资源,供人们检索分享,成为近年来的研究热点。提出了逆向搜索匹配算法(RSM),用于识别深层网查询表单控件的标签。算法将查询表单看作有序的文本和控件序列,结合控件类型以及与文本的间隔关系进行标签识别。通过4组数据的实验,验证了所提出方法的有效性。  相似文献   

5.
信息管理系统动态表单技术的研究与实现   总被引:2,自引:0,他引:2  
针对企业信息管理系统的固定表单技术不能满足企业因服务变化引起的需求变化问题,提出了基于SSH(Struts、Spring、Hibernate)架构,结合改进的Ewebeditor编辑器定义表单属性信息及结构样式信息并运用HtmlParser超文本分析技术提取相关信息来实现信息系统中表单动态定制的技术,同时阐述了自定义表单数据的动态呈现、动态传输和动态访问技术,并给出了该设计关键技术的细节和实现方法.  相似文献   

6.
针对深层网中数据量大导致无法被传统搜索引擎索引的问题,在提取网页中,改进启发式规则识别表单查询入口,在表单标签与内容匹配时,改进基于语义的相似度匹配算法进行表单内容填充。实验结果表明,提取表单标签的准确率达到94.23%,匹配成功率达到88.83%,填充成功率达到95.43%。  相似文献   

7.
针对深层网中数据量大导致无法被传统搜索引擎索引的问题,在提取网页中,改进启发式规则识别表单查询入口,在表单标签与内容匹配时,改进基于语义的相似度匹配算法进行表单内容填充。实验结果表明,提取表单标签的准确率达到9423%,匹配成功率达到88.83%,填充成功率达到95.43%。  相似文献   

8.
王社伟  杨海成  莫蓉 《计算机工程与设计》2011,32(8):2689-2691,2733
针对航空发动机装配生产中使用大量表格的特点,提出了动态表单解决方案,研究了各种表格数据的结构化存储技术,实现了装配过程的数字化管理。对基于表单的发动机装配流程进行建模,分析了表单的结构,建立表单的通用模型。使用面向对象技术,设计了表单系统的关键类,基于关系数据库设计了表单的结构化存储方案。设计了表单引擎,实现了表单数据的解析和结构化查询。最后结合发动机装配流程,应用该系统实现了装配过程的数字化管理。  相似文献   

9.
王征  徐培文 《计算机科学》2012,39(11):187-190
基于人工检索和顶置的网站优化系统工作效率低下,响应速度慢。为消除上述问题,提出并设计了基于互联 网用户心理挖掘的网站深翻系统。该系统通过相关网站及自身的观点挖掘活动,检索近期网络热点,并根据历史信息 对客户需求进行测度和提取;最终将按照客户的观点需求和当前热点,从历史数据库中提取既往信息进行网站优化。 仿真实验表明,该系统能够较好地实现互联网用户心理挖掘及网站的搜索引擎优化,提高网站点击率。  相似文献   

10.
本文重点研究以遥感为主的多源信息综合处理技术,取得的主要成果是:对遥感数据采用特定的图像处理,减弱了植被、冻土带的干扰;开创性地从能谱图像中定性、定量地提取铀信息和从地球化学场角度揭示构造蚀变带;研究岩石反射光谱特征,突出找矿蚀变信息;利用重、磁图像挖掘深层构造信息及首次成功地研制出高几何配准精度的综合找矿预测影像图等。应用这些成果指导找矿,取得突破性进展,地表矿体和矿化体的揭露,显示出该项技术的  相似文献   

11.
在Web数据挖掘研究领域中,Web日志挖掘是一个极其重要的应用方面,而数据预处理技术在Web日志挖掘中又起到非常重要的作用.介绍Web日志文件的记录格式和Web日志挖掘预处理的一般过程,针对实际应用中遇到的问题提出一种解决方法,最后给出算法代码.  相似文献   

12.
关于Web Page语义挖掘的目的主要是在现有网络挖掘的基础上对挖掘内容加上语义的表述从而达到提高挖掘的效果.主要先处理挖掘的数据源,然后对数据进行语义标注,建立本体,将本体实例化,形成语义数据库,利用现有的挖掘算法实现挖掘结果.最终得到相对于现有挖掘效果得到提高的结论.  相似文献   

13.
刘先熙 《数字社区&智能家居》2009,5(7):5086-5087,5095
随着Intemet/Web技术的快速普及和迅猛发展,各种信息可以以非常低的成本在网络上获得。如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。Web数据挖掘旨在发现隐藏在Web数据中潜在的有用知识、提供决策支持,已经成为数据挖掘领域中新兴的研究热点。该文主要从Web内容挖掘、Web结构挖掘和Web使用挖掘三个方面阐述Web数据挖掘的基本知识。  相似文献   

14.
Web内容挖掘技术研究   总被引:10,自引:4,他引:10  
简要介绍了Web挖掘的概念、分类以及其功能,阐述了Web挖掘与传统数据挖掘以及Web信息检索之间的关系。给出了Web内容挖掘的不同分类方法、文本以及多媒体文本数据挖掘的定义、分类与应用。重点分析了Web文本挖掘的方法,包括文本的特征表示与抽取、文本的分类与聚类等,讨论了多媒体文本分类挖掘方法。  相似文献   

15.
互联网上的数据规模大、种类多、变化快,而且越来越复杂。通过数据挖掘和分析,可以获取有潜在价值的信息。但是,传统的数据挖掘系统在数据存储和计算性能上存在瓶颈。通过使用云计算技术,设计了一个基于Hadoop架构的网页日志数据挖掘和分析平台来解决这个问题。同时,为了提高挖掘效率,为大规模网页日志挖掘实现了Apriori算法的并行化,并使用该平台验证了该行算法的效率。  相似文献   

16.
通过对远程教育网站的流量进行分析及预测,及时发现网络流量的异常情况,以便网管人员及时采取措施,预防意外的发生。该文首先对远程教育网站的安全性进行分析,然后提出了一个通过分析及预测网站流量对系统进行安全监测的系统。该系统由SOM及FIS两部分组成,主要采用了数据挖掘技术、模糊理论及神经网络技术。通过MATLAB对环境进行模拟,效果良好。  相似文献   

17.
基于web挖掘的用户服务研究   总被引:3,自引:0,他引:3  
数据丰富而知识贫乏导致了知识发现和数据挖掘领域的出现。基于Web的数据挖掘,是从Web海量的数据中自动、智能地抽取隐藏于这些数据中的知识,分析了Web挖掘技术的概念、特点、技术等。根据Web数据挖掘最流行的分类,可以分为Web内容挖掘、Web结构挖掘和Web使用记录挖掘。其中Web使用挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理。该文根据Web数据挖掘的最近研究状况,主要论述了一个更新的频繁路径集的挖掘浏览模式在Web用户个性化服务中的应用,同时,还对发现的知识讨论了其在在线服务中的应用并给出了相应算法。  相似文献   

18.
信息时代的到来,伴随着海量数据的不断出现,web挖掘为当今海量数据处理提供了强有力的技术手段。介绍了Web挖掘的概念.给出了Web挖掘的三种分类,并针对内容挖掘、结构挖掘、使用挖掘论述了Web挖掘在搜索引擎、电子商务、疾病防治等方面的应用。提出了Web挖掘存在的问题,最后展望了Web挖掘的未来努力方向。  相似文献   

19.
Web使用模式挖掘的研究   总被引:6,自引:0,他引:6  
Web挖掘是传统数据挖掘技术在Web环境下的应用,Web挖掘分为Web内容挖掘、Web结构挖掘和Web使用模式挖掘。Web使用模式挖掘是从用户浏览网站的数据中抽取感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构或为用户提供个性化的服务。文章主要论述了Web使用模式挖掘。  相似文献   

20.
信息时代的到来,伴随着海量数据的不断出现,web挖掘为当今海量数据处理提供了强有力的技术手段。介绍了Web挖掘的概念,给出了Web挖掘的三种分类,并针对内容挖掘、结构挖掘、使用挖掘论述了Web挖掘在搜索引擎、电子商务、疾病防治等方面的应用。提出了Web挖掘存在的问题,最后展望了Web挖掘的未来努力方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号