排序方式: 共有63条查询结果,搜索用时 15 毫秒
1.
2.
3.
4.
5.
6.
7.
网页分类中存在类别多、训练样本少等问题,一般分类器训练应用效果不佳。为了解决这个问题,提出基于类中心的统计学习方法。在较少人工标注网页的训练集情况下,此方法能取得很好的分类性能并且大幅度加快训练时间,并可以通过加入网页层次目录信息提升推理速度。在第一届LSHTC评测数据集上进行实验,结果表明:基于类中心的统计学习方法拥有较快的训练以及推理速度,并且在正确率上有很强的竞争力。 相似文献
8.
k-best MIRA和动态k-best MIRA 总被引:1,自引:0,他引:1
MIRA(Margin Infused Relaxed Algorithm)是一种超保守算法,在分类、排序、回归等应用领域都取得不错成绩.文中在传统MIRA算法基础上进行改进,提出k-best MIRA(K-MIRA)与动态k-best MIRA(DK-MIRA)算法.这两种算法能够根据学习进程自动调整优化约束条件,从而提高算法的收敛速度与性能.将K-MIRA与DK-MIRA用于定义类问题回答中的句子排序任务,取得较为满意的实验结果. 相似文献
9.
文章针对列表类自动问题回答的任务要求,提出了一种基于短语检索和答案距离排序模型的列表类问题回答的方法。该短语检索模型在传统的TF/IDF检索模型上进行改进,提出了利用不同长度短语作为查询词的检索方法,能够返回更多包含正确答案的相关文档;答案的距离排序模型则利用答案与上下文词之间的距离作为排序的依据对答案列表进行排序,可以提高正确答案的排名。这两种模型地提出在一定程度上解决了如何在返回尽可能多的答案的同时保证答案质量的问题。实验结果表明利用这两种模型的列表类问题回答方法对系统的性能有显著提高。 相似文献
10.
文本检索会议简介 总被引:3,自引:0,他引:3
文本检索简介随着互联网的发展和存贮技术的提高,计算机可读的文本信息也越来越多。据估计,截止到1999年,互联网上已约有5TB的信息容量,其中文字信息约为6TB。然而,要有效地开发利用如此丰富的信息资源并不是轻而易举的事情,因为许多信息往往是规模巨大,实时性强,而且存贮分散;语言混杂,内容广泛;图文并茂,格式灵活,有时还含有一定的拼写错误或传输错误。而对于特定的用户而言,所需要的信息往往只占其中极小的一部分。要从如此规模的网络信息中抽取有用的信息资源,对信息处理的速度和精度将提出极为严格的要求,因而迫切需要对这种形式的混合语料进行更快速高效的处理。在这种情况下,人们越来越多地依靠文本检索工具来寻找自己所需要的信息。文本检索指的是给定文本方式的检索需求,在电子文档库中查找出与指定表达式相匹配的文本,并将出现和包含这些文本的原文作为检索结果返回给用户。 相似文献