共查询到20条相似文献,搜索用时 109 毫秒
1.
主要介绍了面对万维网上各种各样的诸如文本、声音、图形和图像等语料信息,如何按照用户的实际需求将其中对用户有用的信息抽取出来,从而实现对现有语料信息的一种有效分离。重点介绍了Web信息簇聚性的特点和语料库的设计,以及语料库的实际工作原理。 相似文献
2.
3.
4.
文章提供了一种在Web页面中仿真Word的实现方法,它不仅在使用上与Word几乎完全相似,而且可以直接复制Word文档的全部内容,包括表格、文字格式及图片等。该方法方便快捷,实现了在Web中排版的所见即所得的功能。 相似文献
5.
Web页面中计数器技术研究 总被引:9,自引:0,他引:9
Web页面计数器能够直观地反映该Web站点受关心的程度,一个好的Web页计数器应该方便使用,并具有较高的性能,Web页面计数器技术充分反映了动态Web页面技术的发展现状,本文给出了几种实现了Web页面计数器的技术,并对这些进行了比较。 相似文献
6.
有很多不同的分块算法都可以对web网页进行分块.研究分块的1/1的是为了相关领域进一步研究的需要。例如通过页面块内容的重要程度研究基于块的搜索、定位网页的重要主题或内容,研究网页主要内容或主题的抽取,以及基于Web页面分块的Web存档等。首先给出Web页面分块问题定义和分类,并对几种典型的分块算法进行原理剖析,为进一步研究web页面分块问题提供一些有益的参考。 相似文献
7.
通过对现有Web信息抽取方法和当前Web网页特点的分析,发现现有抽取技术存在抽取页面类型固定和抽取结果不准确的问题,为了弥补以上两个不足,文中提出了一种基于页面分类的Web信息抽取方法,此方法能够完成对互联网上主流信息的提取。通过对页面进行分类和对页面主体的提取,分别克服传统方法抽取页面类型固定和抽取结果不够准确的问题。文中设计了一个完整的Web信息抽取模型,并给出了各功能模块的实现方法。该模型包含页面主体提取、页面分类和信息抽取等模块,并利用正则表达式自动生成抽取规则,提高了抽取方法的通用性和准确性。最后用实验证实了文中方法的有效性与正确性。 相似文献
8.
9.
当我们在网上从一个页面转到另一个页面或从一个站点转到另一个站点时进行浏览时,常常要花很多时间等待网页下载;当网页下载到浏览器时,网页内容又是突然出现。为消除浏览过程中的这种停顿或突出的现象,文章介绍了一种使在网页浏览过程中网面间平滑过渡的处理方法。 相似文献
10.
随着Internet的迅猛发展,网络信息呈爆炸式增长。Web信息检索是一个从Web海量数据中检索用户感兴趣信息的综合技术,它从一定程度上满足了用户对信息的需求,但返回页面的数量依然十分巨大。如何对搜索结果进行排序已成为影响搜索质量的一个重要问题。本文介绍了两种页面排序算法PageRank和HITS,并对网页排序算法的若干改进进行了讨论。 相似文献
11.
针对支持向量机在特征选择方面具有自动选择的功能,提出了一种改进的最少核分类器。在样本测试中使用更少的特征维数,减少识别过程计算量。数值试验表明,改进过的分类器能有效压缩无用的特征属性,具有较强的泛化能力。 相似文献
12.
13.
14.
15.
16.
冼广铭 《计算机工程与应用》2008,44(18):36-38
针对目前使用的SVM核函数在回归中不能逼近任意目标函数的问题,在支持向量机的核方法和小波框架理论的基础上,提出了LS-WSVM结构模型。该模型在LS-SVM中使用一种新的由小波构成的SVM核函数。实验结果表明,与标准的SVM及LS-SVM比较起来,在同等条件下,LS-WSVM在函数回归方面LS-WSVM具有优良的逼近性能,拟合效果更为细腻。 相似文献
17.
18.
19.
在实际应用中的分类数据往往是非平衡数据,少数类别的数据可能有很大的分类代价。分类性能不仅要考虑分类精度,同时要考虑分类代价。该文扩展了支持向量机(SVM)学习方法,对于以高斯核为核函数时的少数类和多数类使用不同的惩罚参数C+, C-以获得高敏感度的超平面,并提出利用遗传算法对SVM的学习参数进行优化调整。给出一种新的评价函数,对分类结果的质量进行评价。实验结果证明,算法对于非平衡数据的分类有较好的效果,对少数类样本预测的准确性较高。 相似文献
20.
针对现有数字信号调制分类的问题,在人工分类的基础上,提出一种基于支持向量机(SVM)的自动分类方法。提取信号的高阶累计量特征参数用于训练与测试数据。比较已有的基于SVM的调制分类方法,采用应用混合核函数的SVM分类方法,并利用决策树二分类思想设计分类流程。经过仿真比较,验证了该混合核函数的SVM具有较好的分类性能。 相似文献