首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
随着信息技术的快速发展,人们从网络上发布、获取信息也越来越多,但网络上浩大的信息量也使得人们从网络上抽取信息的难度也越来越大。如何从网络上海量的信息中找出对自己有用的信息,是人们关注的问题。在此背景下,该文设计了WEB信息抽取系统,改信息抽取工具提高了系统的灵活性,可以充分利用现有资源。  相似文献   

2.
随着Internet的快速发展,网络已成为人们查询信息的重要渠道。Web作为巨大的数据源,从Web中提取知识是当前研究的热点之一。在这些海量信息中,大多都是基于HTML的。该文提出一种基于HTML结构的Web就业信息抽取模型。  相似文献   

3.
基于本体的WEB表格信息抽取   总被引:9,自引:0,他引:9  
本文给出了一个基于本体的WEB表格信息抽取方法,在信息的抽取过程中,利用学习手段,逐渐完善本体的构造,从而增强本体对应用领域的描述能力,使系统的信息抽取自动化程度逐渐提高。  相似文献   

4.
为了整合复旦图书馆数字化论文资源,来为教授提供个性化推荐服务,使用sniffer监听网络信息,模拟IE的浏览行为,实现了针对Vip、ISI和Metalib三个数据源的Deep Web Crawler,并研究了通用Deep Web Crawler的系统框架和功能模块.  相似文献   

5.
信息抽取模式自动生成方法的研究   总被引:7,自引:3,他引:7  
模式匹配是信息抽取系统通常使用的方法,如何生成信息抽取模式就成为信息抽取的关键问题。由于手工编写模式的代价太大,本文尝试采用聚类方法自动生成针对中文文本的信息抽取模式。通过计算模式实例间的相似度,采用单链法聚类,将模式实例划分为不同的类别,每个类别对应一个模式,将同一类别中的模式实例进行合并就可以得到最终的信息抽取模式。以农作物信息文本为实验语料,进行了聚类测试,错分率与漏分率分别为0.21%和1.07%,合并后的模式覆盖了人工分析提出的25类中的24类。  相似文献   

6.
随着互联网的发展和普及,Internet上的信息急剧增长,能够自动获取适用,简单和精炼的信息,成为人们的迫切希望.同时针对农村互联网条件差而手机越来越普及的情况,我们设计实现了一个基于WEB信息抽取和GSM的主动服务系统.本文在分析农产品供求信息网页结构的基础上,提出了一种基于内容和web文档结构路径(DOM)相结合的信息抽取算法.最后实验结果说明该抽取算法能够很好地制定抽取规则并能够准确的抽取所需要的内容.  相似文献   

7.
本文提出了一个基于WEB环境的学生毕业论文/设计信息交流系统。应用动态服务器页面实现了于学生毕业论文信息交流的目的.设计出系统框架以度信息交叉传递等功能的技术实现。  相似文献   

8.
按照WEB开发的应用中是否使用独立的WEB服务器,WEB开发的应用模式分为依赖式和独立式两种。在对两种应用模式的开发技术和手段进行归类分析的基础上,分别对每种应用模式的各自特性从技术角度进行概括性论述。通过上述分析和讨论。目的在于建立较全面的WEB开发的应用模式体系概念,丰富和延伸WEB开发的应用框架结构。  相似文献   

9.
本文讨论了WEB的银行信息服务系统,介绍岳阳中行企业内部网及其应用,包括总体设计,和主要实现技术。  相似文献   

10.
基于动态异构的Web信息集成网页分析方法   总被引:1,自引:0,他引:1  
将动态异构的Web信息资源进行抽取以统一的方式供用户查询和使用,是当前迫切需要解决的问题。介绍了分析相关Web页面的方法和经验,实现了自动提交HTML表单获得所需页面和对页面的信息抽取。最后,实验证明了此方法的有效性。  相似文献   

11.
李树成  田学东 《微机发展》2005,15(8):145-147
提出了一种结合最新TDT技术、基于增强学习的优先Web环境主题搜索策略,并以此设计主题搜索器系统。该系统通过引入基于领域知识的TDT文本分类技术,大大改进了基于关键字的Naive Bayes模型主题相似性判别的准确性;通过引入基于增强学习的页面评估函数特征化主题Web环境,有效地提高了稀有信息的搜索能力。试验结果表明,该系统具有较高的实用性。  相似文献   

12.
为了从具有海量信息的Internet上自动抽取Web页面的信息,提出了一种基于树比较的Web页面主题信息抽取方法。通过目标页面与其相似页面所构建的树之间的比较,简化了目标页面,并在此基础上生成抽取规则,完成了页面主题信息的抽取。对国内主要的一些网站页面进行的抽取检测表明,该方法可以准确、有效地抽取Web页面的主题信息。  相似文献   

13.
介绍了一种多策略联合信息抽取方法——MSCIE(Multi-Strategy Comtbination Information Extraction).MSCIE将对表格式网页的信息抽取分为基于网页结构特征分析的信息抽取和基于模式匹配的信息抽取,提出了一种对网页DoM(Document Object Moclel)树的冗余信息进行剪枝分析的方法和一种实体特征模式发现算法分别用于这两种信息抽取方法,并通过两种策略联合完成信息抽取工作.应用于互联网竞争情报监测系统中,从大量网站中抽取多种商品的供求信息,取得了较高的准确率和召回率(平均在95%以上)。  相似文献   

14.
Web服务搜索技术综述*   总被引:1,自引:0,他引:1       下载免费PDF全文
随着Web服务应用的迅速发展与日益普及, 如何快速、准确地搜索到用户所需的Web服务成为了制约Web服务发展的关键问题之一。目前的Web服务搜索技术包括:基于UDDI注册中心、通过Web服务网站、使用专用搜索引擎与使用通用搜索引擎四种方式。对现有主要Web服务搜索技术进行了详细评述。在对典型Web服务搜索技术分析比较的基础上, 指出了建立专用的Web服务搜索引擎的必要性以及所面临的问题与挑战。  相似文献   

15.
专题学习网站"糖尿病"的构建   总被引:2,自引:0,他引:2  
介绍“专题探索——网站开发”这种崭新的学习模式,通过网站体系结构的设计和应用网站建设技术,实现“糖尿病”专题学习网站。网站的构建作为学习的过程和结果,能将专题知识的学习、综合能力的培养、信息技能的培养几个目标有效结合起来,实现信息技术与课程的有机整合。  相似文献   

16.
李琦  黄丰  涂勇 《计算机科学》2007,34(2):111-114
空间信息门户为用户提供一个统一的入口访问分散异构的空间信息资源,是国家空间信息基础设施的重要组成部分。传统的空间信息门户大多采用OGC在空间信息门户参考体系架构中推荐的“发布-检索-绑定”模式,本文提出一个新的基于Web信息搜索的体系架构,并对其中空间元数据自动提取等关键技术进行了研究,最后通过原型系统进行验证。  相似文献   

17.
一种Web信息的启发式检索方法   总被引:3,自引:0,他引:3  
Internet是一个开放的全球分布式网络 ,资源分布在世界上不同的地方 ,并且网上资源没有统一的管理和结构 ,导致了信息搜索的困难 .同时 ,Internet是一个有巨大价值的信息源 .因此 ,研究一种快速、高效的 Web信息检索方法是很有实用意义的 .本文提出了一种用相关度及用户兴趣作为评价函数在 Internet上进行启发式搜索及在此基础上利用机器学习有效的实现搜索知识重用的方法  相似文献   

18.
一种基于语义匹配的Web信息提取方法研究   总被引:1,自引:0,他引:1  
为了较好地解决信息过量难以消化、汉语词的歧义划分、Web信息形式不一致并且难以辨识的问题,文章提出了一种基于语义匹配的Web信息提取方法。该方法融合了网页分类、汉语分词、语义信息匹配方法,并给出了一种义素相似度,进而提出了一种基于语义的信息匹配方法来识别和提取网页信息项。基于这种Web信息提取方法的网上药品信息监管系统Web-MIND能够提取出网上药品广告的信息项,并具有较高的准确率。  相似文献   

19.
Web检索查询意图分类技术综述   总被引:8,自引:1,他引:7  
查询分类是近年来信息检索领域的研究热点,并且在很多领域得到了广泛地关注。主要讨论根据查询的意图进行分类的研究工作,从查询分类的诞生背景、关键技术、所使用的分类方法和评价方法方面进行综述评论,提出了查询意图分类面临的问题和挑战。认为缺乏权威的评测标准、在大规模数据集上的未经全面测试的性能、如何准确地获取查询的特征以及如何证明分类体系的完备性和独立性是目前查询意图分类研究的关键问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号