排序方式: 共有8条查询结果,搜索用时 15 毫秒
1
1.
2.
基于DCM的中文文本分类 总被引:1,自引:0,他引:1
当前提出的中文文本分类或多或少都存在分类速度或分类效果不佳的问题。使用DCM分类方法,采用国家语委平衡语料库进行分类测试,取得了开放测试平均查全率90.35%、平均准确率90.87%和封闭测试平均查全率98.36%、平均准确率98.74%的分类效果,说明DCM算法在分类效果上优于目前其他的中文文本分类方法。 相似文献
3.
LSI模型在信息检索中的应用 总被引:1,自引:0,他引:1
介绍了LSI技术在中文信息中的应用及其在实际应用中可能会出现的问题,并给出了解决办法。通过将查询和文档在多维空间进行投影,将共现词投到同一维上,建立“词-文档”高维空间,使用SVD方法对高维空间进行分解、降维,得到词、文档、查询的向量表示,达到对中文信息的检索;使用PRF(Pseudo Relevance Feedback)技术对其进行改进。 相似文献
4.
基于已有的带宽管理机制,采用加权公平对竞争的流分配带宽,不仅可以对流实现准入控制,以保证每条流的最低信道时间需求,同时也能动态地调节流所分配的信道时间。另外,我们的方案,也适用于多跳的情况,通过例子说明,在考虑到用户需求的同时,也提高了网络的吞吐量。 相似文献
5.
6.
SMO(序贯最小优化算法)算法是目前解决支持向量机训练问题的一种十分有效的方法,但是当面对大样本数据时,SMO训练速度比较慢。考虑到在SVM的优化过程中并不是所有样本都能影响优化进展,提出了两种删除样本的策略:一种是基于距离,一种是基于拉格朗日乘子的值。在几个著名的数据集的试验结果表明,两种策略都可以大大缩短SMO的训练时间,特别适用于大样本数据。 相似文献
7.
8.
1