排序方式: 共有148条查询结果,搜索用时 15 毫秒
101.
Email自动分类已成为半结构化文本信息自动处理的研究热点。本文在时已有Email自动分类方法深入研究的基础上,提出了一种基于SVM和领域综合特征的Email自动分类方法。主要包括:一是将SVM引入到Email自动分类研究中,并对SVM学习算法中的核函数和参数选择进行了探讨;二是鉴于词频的特征表示方法难以准确表示Email主要内容,因此将领域知识引入Email特征表示中,并在此基础上提出了一种综合领域知识和词频的特征表示方法,用于Email分类。该方法是在词频特征的基础上加入人工总结出的领域特征,从而更能准确地表示Email的主要内容,以提高Email分类的平均F-score。通过实验,验证了基于SVM和领域综合特征的Email自动分类方法能有效地提高Email自动分类处理的准确性。 相似文献
102.
一种基于《知网》的中文文本聚类算法的研究 总被引:3,自引:0,他引:3
针对基于关键词集的中文文本聚类算法中存在的问题,将《知网》引入到中文文本的特征表示中,并在此基础上提出了一种基于《知网》的中文文本聚类算法。该算法在中文文本表示中加入了基于《知网》的概念特征,实验结果表明该算法能够更好地将语义相关的中文文档聚集在一起,与传统的基于关键词集的中文文本聚类算法相比,聚类质量得到了较大提高。 相似文献
103.
范例推理系统中的范例库维护 总被引:5,自引:0,他引:5
在范例推理系统中,系统的学习会使范例库逐渐增大,一般来说范例库越大,知识越丰富,但也不能无限增加,否则会大大增加相似范例检索的时间,降低系统的总体性能。因此范例推理学习系统必须有维护功能,主要目的是限制范例库的无限膨胀,且能保持系统的性能。本文在给出一个改进的删除策略维护方案的同时,并从另一角度出发,提出一个基于范例增加的维护策略,以保证系统的性能不受影响,从而达到小范例库强功能的目的。 相似文献
104.
互联网中文信息获取研究 总被引:1,自引:0,他引:1
提出了一种以智能化、主动搜索为标志的互联网中文信息获取方法,实现了一种互联网中文信息智能获取工具,该工具采用智能Agent的体系结构,通过学习用户日常的文档和用户的交互意见推测出用户需求,建立个性化的用户模型。并使用元搜索引擎从互联网上主动获取信息。最后通过本地智能处理技术,剔除合并重复及相似性大的信息,将处理后的结果以显明易懂的方式提交给用户。 相似文献
105.
基于路径学习的信息自动抽取方法 总被引:7,自引:0,他引:7
针对用户需求的网页信息自动抽取是解决互联网信息爆炸问题的一个有效途径 ,然而现有的信息自动抽取方法均难以同时满足网页信息自动抽取中查全率与查准率高、抽取速度快、抽取信息量大和用户负担轻的要求 .本文提出了一种基于路径学习的信息自动抽取方法 ,并采用该方法编制了一个商品价格信息自动抽取系统 .实验结果表明 ,该方法具有用户负担较轻 (只需用户提供 2~ 4个学习实例 )、查全率 (97.0 4~ 10 0 % )与查准率 (99~ 10 0 % )高、可实现大样本量信息抽取和时间资源耗费少 (抽取时间 <1秒 )等特点 ,能基本满足网页信息自动抽取的要求 . 相似文献
106.
范例推理中基于时序的范例匹配方法模型 总被引:8,自引:0,他引:8
用传统的最近邻检索和匹配算法找到的最相似范例,由于时间的变迁,在实际应用中,该范例的解决方案对于新问题的解决不一定是最有用的,因而也不是最优的,为了解决这个问题,本文提出了一种基于时序的范例匹配方法模型,为找到最优相似范例提供了一条有效途径。 相似文献
107.
OLAP系统中用户浏览行为模型分析 总被引:1,自引:0,他引:1
用户在OLAP系统中的行为往往有一定的规律.在认定用户的查询意图相对稳定的前提下,分析用户的行为能提高OLAP系统的性能.而在分析用户的行为之前,选择合适的用户查询模型,记录用户的行为显得尤为重要.本文提出一个模型,包含了绝大多数的OLAP系统的操作.该模型可比较完整的记录了用户的查询浏览行为. 相似文献
108.
基于垂直数据分布的关联规则高效发现算法 总被引:14,自引:0,他引:14
文章分析了在KDD研究中现有的关联规则发现算法关于频繁项目集的生成与测试方法,提出了一种新的基于垂直数据分布的关联规则发现算法.该算法无需复杂的Hash数据结构,仅需对整个数据库作两次遍历,从而既方便了实现,又提高了效率. 相似文献
109.
人工智能与计算机科学中的许多问题都可视为约束满足问题,为了简化问题的求解,常采用局部一致性方法减小搜索空间。本文首先介绍与分析了着眼于全局一致性的局部处理的理论与方法,以及尽可能消除回溯因素的局部一致性方法,最后给出了一种在减少局部一致性维护代价上优于已有方法的新算法。 相似文献
110.