首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 117 毫秒
1.
通用的网页编辑工具忽视了不同用户在数据需求方面的个性差异,降低了网页编辑工具的使用效率,本文提出了一种基于可视化文档和数据库技术的个性化网页编辑器的新思路,通过对网页编辑器个性化特征的分析,介绍了这一编辑器的结构和功能。并给出利用Borland C Builder的VCL组件实现文档可视化设计的方法。  相似文献   

2.
WEB上存在着大量数据,为了有效地利用这些数据,必须把它们从WEB页面中获取出来存放到数据库中.本文首先介绍了WEB环境下数据获取的相关概念与技术,基于此,提出了一种基于XML的WEB数据获取系统结构,讨论了它的主要组成.最后,给出了系统的实现方法.  相似文献   

3.
本文介绍了在Visual C++下实现的一个通用的类CHtmlCtrl,利用该类可以很方便的在对话框中浏览HTML网页,并且介绍了在可执行文件或动态连接库中加入HTML资源的方法,并提供了一个利用本文提供的CHtmlCtrl类浏览资源中的HTML网页的例子。  相似文献   

4.
平行语料库是对机器翻译、跨语言信息检索等应用技术具有重要支撑作用的基础数据资源。虽然互联网上的平行网页数量巨大且持续增长,但由于平行网站的异构性和复杂性,如何快速自动获取高质量的平行网页进而构造平行语料库仍然是巨大的挑战。该文提出了一种URL模式与HTML结构相结合的平行网页获取方法,首先利用HTML结构实现平行网页的递归访问,其次使用URL模式优化遍历平行网站的拓扑顺序,从而实现高效准确的平行网页获取。在联合国与香港政府两个平行网站上的实验表明,该方法相对传统获取方法在获取时间上减少50%以上,准确率提高15%,并显著提高了机器翻译的质量(BLEU 值分别提高1.6 和0.7 个百分点)。  相似文献   

5.
基于文本分析的知识获取系统设计与实现   总被引:1,自引:0,他引:1       下载免费PDF全文
知识获取一直以来都是构建专家系统的瓶颈问题.针对该问题,利用自然语言处理技术,设计并实现一个针对化学科技文献进行分析的知识获取系统,并对其关键技术进行分析.系统对输入文本进行分词及词性标注,在此基础上,使用Tregex在句法分析树上进行实体识别,同时利用依存关系进行搭配词识别.实验结果表明了该系统的有效性.  相似文献   

6.
在知识获取中,手工填槽是一件繁琐而又枯燥的工作,效率很低。针对一类词条的处理提出了一个面向辞典的知识获取系统,通过分析辞典中文本的特征,最大可能地实现了填槽的机器自动生成,该系统分为三个子系统:词语识别子系统、规则匹配子系统、运行填槽子系统,完成了文本识别、规则匹配和运行填槽功能。  相似文献   

7.
在知识获取中,手工填槽是一件繁琐而又枯燥的工作,效率很低。针对一类词条的处理提出了一个面向辞典的知识获取系统,通过分析辞典中文本的特征,最大可能地实现了填槽的机器自动生成,该系统分为三个子系统:词语识别子系统、规则匹配子系统、运行填槽子系统,完成了文本识别、规则匹配和运行填槽功能。  相似文献   

8.
动态查看客户机屏幕显示内容是监控软件、网络教学软件的核心功能。本文将介绍实现此功能的流程及算法研究,并用VB6创建应用实例。  相似文献   

9.
BBEST图形获取子系统是BBEST的一个辅助生成工具。它提供了鼠标输入、数字化仪输入和字符及汉字输入,能方便地完城二维图形的生成、变换、存取等操作,并有简单的处理三维的能力。本文着重介绍它的数据结构、模块结构、以及若干实现算法。  相似文献   

10.
11.
基于模块的网页设计技术   总被引:1,自引:0,他引:1  
在信息资源迅速增长的今天,如何Web大量的信息进行高效地组织和维护,以及提高Web上搜索和浏览信息的速度和性能是我们面向对的一个重要问题,从模块化的程度设计思想中得到启发,提出了一种模块化网页设计技术,该技术在网页快速制作,模块重用,数据一致性维护,快速浏览以及信息检索等方面具有一定的参考价值。  相似文献   

12.
教学网页的设计   总被引:1,自引:0,他引:1  
针对如何有效地组织教学网页的信息,以方便用户检索和抓住要点,本文介绍了有关的设计思想,主要包括在网页中添加“选项卡”功能等。  相似文献   

13.
无论是门户网站还是如今流行的B/S结构的企业MIS,都是靠网页来展现它的内容、与用户进行交流。网页可以简单地描述为"内容 表现",CSS(Cascading Style Sheet,级联样式表)是最好的网页"表现"技术,它使用一套完整而且灵活的规则,将网页的内容和表现方法彻底分离,利用它能设计出具有复杂布局的精美网页,并且代码简洁、干净、易于调整和维护,为网页设计人员和维护人员节省大量的时间和精力,提高企业的经济效益。  相似文献   

14.
介绍了在Web应用程序开发中,将比较大的报表进行分解组合处理,在页面中显示特大型报表的方法。并给出利用ASP技术访问数据库及HTML中分帧技术实现Web页面中特大型报表的具体程序。  相似文献   

15.
随着互联网的发展,网页形式日趋多变。短正文网页日益增多,传统的网页正文自动化抽取方式对短正文网页抽取效果较差。针对以上问题,该文提出一种单记录(新闻、博客等)、短正文网页的正文自动化抽取方法,在该方法中,首先利用短正文网页分类算法对网页进行分类,然后针对短正文网页,使用基于页面深度以及文本密度的正文抽取算法抽取正文。  相似文献   

16.
基于CSS的网页分割算法   总被引:1,自引:0,他引:1  
在页面变换,信息抽取,信息过滤等应用中,首先需要将原始页面分割成为若干合适的信息块以便于后续的处理.本文提出了一种基于CSS的网页分割算法,通过对网页进行解析和布局处理,提取出其中的CSS信息,并且使用重复模式检测和聚类的方法对生成的CSS树进行分割.试验证明该方法能够有效地分割网页,并且不依赖于特定的浏览器,适合嵌入式系统使用.  相似文献   

17.
针对网页的正文信息抽取,提出一种基于支持向量机(SVM)的正文信息抽取方法。该方法采取宽进严出的策略。第1步根据网页结构的规律遍历网页DOM树,定位到一个同时包含正文和噪音信息的HTML标签。第2步选择含噪音信息的HTML标签的5个重要特征,并采用SVM训练样本数据。SVM训练得出的数据模型可以有效去除导航、推广、版权等噪音信息,成功保留正文。将该方法应用于几大常用的网站,实验结果表明该方法具有较好的正文抽取效果和降噪效果,对于传统方法中经常误删的短文本、与正文相关的超链接等信息能够准确保留。  相似文献   

18.
随着人们对网络应用需求的不断增长,网页的内容也逐渐丰富起来,结构更加复杂.导航是网页设计的关键元素,竖直和水平排列的一级菜单往往无法满足用户的需求.传统的下拉菜单制作方法有一定的局限性,功能不易扩展,而且代码过于繁琐.CSS技术能够使网贞的内容与表现相分离,代码简浩、易于修改.文中基于CSS设计和实现了一个两级下拉菜单,克服了传统实现方法的不足,结构简单,网页空间占用少,可扩展性强,可以广泛应用在网页设计中.  相似文献   

19.
针对互联网日益泛滥的色情信息,分析了向量空间模型中KNN算法,并对它的缺陷进行了改进,将其运用于色情网页过滤中,提出了一种色情网页过滤解决方案。该方法首先对特征项的选取和权重计算的方法进行了优化,然后使用改进后KNN算法进行网页分类。实验表明,通过改进,有效地降低了向量空间的维数,提高了网页分类的精度和速度,能有效地识别并过滤色情网页。  相似文献   

20.
一种面向中文敏感网页识别的文本分类方法   总被引:1,自引:0,他引:1  
陈欣  张菁  李晓光  卓力 《测控技术》2011,30(5):27-31
提出了一种面向中文敏感网页识别的文本分类方法,主要包括中文分词、停用词表的建立、特征选择、分类器等4个部分.为丰富中文分词词库,提出了一种以词频统计为主、以人工判决为辅并标注词性的新词识别算法;提出了一种停用词表的建立算法,据此建立了含300个停用词的停用词表;采用开方拟合检验统计量方法作为特征选择方法,并确定了400...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号