首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
本文主要针对不良内容的敏感信息出现的特征变化,提出一种基于文本内容的不良信息过滤的文本预处理方案,并着重探讨了其结构变化的敏感信息的识别及解决的方法。研究表明在文本的分词处理方面,对不良信息形式的变化进行预处理,能够提高过滤的效率。  相似文献   

2.
在Delphi7下,使用IntraWeb实现了两种形式的HTML文本编辑器,前者不可上传文件,后者能够上传文件。详述了其实现的关键步骤并给出了所有源代码。  相似文献   

3.
文本转为HTML     
为了使你的主页有访问的价值,需要经常将有关的文件放置到主页上。如果要将以前积累的文本文件放到网上,就需要事先将其转换为HTML格式。 如果只有少数的几个文本文件要转换为HTML格式,事情就很简单了,转换起来也比较容易。用Word将要转换的文本文件打开,执行“文件”菜单中的“另存为”,在“保存类型”下拉框中选择HTML项目,“保存”后即可得到一个HTML文件。这个HTML文件比较简陋,例如没有前景和背景颜  相似文献   

4.
一种新的HTML页面清洗压缩算法   总被引:1,自引:0,他引:1  
任仲晟 《福建电脑》2009,25(1):60-61
本文提出了一种新的适用于Web信息抽取的HTML页面清洗压缩算法。该算法充分利用了HTML页面树中各标签的相对位置信息。实验表明,该算法能够有效地处理页面中的语法错误,并实现对页面冗余数据的压缩。具有良好的实用价值和应用前景。  相似文献   

5.
在delphiXE下用IntraWeb实现了HTML文本编辑器.详述了其实现的关键步骤,并给出了所有源代码.  相似文献   

6.
文本自动分类系统文本预处理方法的研究   总被引:3,自引:0,他引:3  
在没有建立起完善的中文停用词表的情况下,运用程序流程控制剔除中文分词器切分出来的单个独立字、英文字符、数字和一系列数学符号以及含有这些符号的中文词,从而使得两个字以上的纯中文词成为代表文本信息的特征项。这不仅明显降低了初始文本向量的维度,而且大大提高了文本向量中的特征信息含量。  相似文献   

7.
HTML邮件     
在Jason Arber看来,接进HTML可以强化并提升你的Email。同时也可以让你的新闻和邀请更为生动有趣。这比你所想的要简单得多……[编者按]  相似文献   

8.
一种不良信息过滤的文本预处理方法研究   总被引:1,自引:0,他引:1  
目前互联网上含有不良内容的文本信息形式多变,本文主要针对不良内容的敏感信息出现的特征变化,提出一种基于文本内容的不良信息过滤的文本预处理方案,并着重探讨了其结构变化的敏感信息的识别及解决的方法。研究表明在文本的分词处理前,对不良信息形式的变化进行预处理,能够提高过滤的效率。  相似文献   

9.
介绍了一种实现多语言HTML文本显示的方法,该方法通过建立微型字体服务器,实现字符信息的非图像传输,节约了传输带宽,提高了传输速度。讨论了该方法的基本原理,实现的方法,与传统方法相比较,阐述了该方法的特点。  相似文献   

10.
基于JFC/Swing文本组件开发HTML语法分析器   总被引:1,自引:0,他引:1  
分析了Java Swing的特点和组成,提出了用Swing文本组件包功能开发HTML语法分析器的构想,并详细讨论了它的实现步骤,最后给出程序代码。  相似文献   

11.
浅谈HTML   总被引:1,自引:0,他引:1  
HTML是构成网页文档的主要诺言,而最新版本的HTML5的新使命是将Web带入一个成熟的应用平台.在HTML5平台上,视频、音频、图像、动画,以及同电脑的交互都被标准化.我们通过对HTML的介绍,来了解HTML的发展,从而更好的了解和学习HTML5.  相似文献   

12.
HTML is being massively used as an interface to provide services to users. Web developers are producing and changing sites at a high pace while trying to support the latest HTML standards. In this context, it is common to find websites that do not comply with the standards and fail to be correctly processed by browsers. Considering this dynamic environment and the increasingly large diversity of browsers with frequent updates, the appearance of problems in web pages is a common, sometimes severe, and hard‐to‐track problem. In this short communication, we describe the initial design of an approach that will be used to obtain information regarding the characteristics of HTML documents on the Web and extract indicators of representative errors made by their developers. Preliminary results show nearly 90% of the pages analyzed having at least one type of error and the prevalence of a small number of error types.  相似文献   

13.
基于HTML标签的信息隐藏模型   总被引:5,自引:0,他引:5  
通过仔细分析HTML标签的各种性质,提出了几种新的基于标签的隐藏信息的方法.在此基础上,提出并实现了一个基于HTML标签的信息隐藏模型.该模型具有隐藏容量高、隐蔽性、鲁棒性和安全性较好,并且具有弹性,能自动调节隐藏算法的参数,使得在满足容量的前提下,尽量提高隐蔽性.  相似文献   

14.
基于HTML的报表系统研制与开发   总被引:8,自引:0,他引:8  
在各种信息系统中,报表是一个重要的环节,针对报表系统已经有很多的工具可以使用,但是由于现实应用的千差万别,导致每种工具都有它的着重点,利用HTML强有力的表格描述语言,提出一种具有高度灵活的报表设计思路,达到适应各种应用情况的目的。  相似文献   

15.
HTML过滤器的分析与模块化实现   总被引:2,自引:0,他引:2  
HTML过滤器是WAP网关平台系统的重要组成部分,其主要功能是实现HTML文档和WML文档之间的内容转换。该文分析了WML文档和HTML文档的相似与差异之处,并提出了一种模块化的HTML过滤器实现方案。  相似文献   

16.
介绍用ASP保护动态HTML的方法。  相似文献   

17.
从HTML的发展变革,到HTML5新特性的细致讲解,整体呈现了HTML5这一新版本带来的巨大飞跃。对初学HTML5的编程和设计人员具体很高的借鉴价值和指导意义。  相似文献   

18.
基于HTML和XML的信息提取方法研究   总被引:2,自引:0,他引:2  
陈红叶 《微机发展》2003,13(Z2):54-55
Web作为巨大的数据源,从Web中提取知识是当前信息研究的热点之一。主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息,并成为将来进行Web挖掘的基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号