排序方式: 共有110条查询结果,搜索用时 15 毫秒
41.
DF还是IDF?主特征模型在Web信息检索中的使用 总被引:11,自引:0,他引:11
Web信息检索的难点之一就是简短、模糊的用户查询与存在大量冗余和噪声的文档之间的不匹配.对Web文档信息特征进行分析,提出Web文档主特征词、主特征域和主特征空间的概念,在该空间上使用文档频度DF(document frequency)信息而非传统意义上的IDF(inverse document frequency)信息进行权值计算,并给出一个改进的相似度计算模型.使用该模型在10G和19G的两个大规模Web文档集合上进行了3组标准测试.比较实验表明,与传统IDF思想相比,在各项评价指标上,DF相关的主特征权值计算方法都能始终较大幅度地提高系统性能,最大达到18.6%的性能改善. 相似文献
42.
43.
基于规则的市场分析方法 总被引:1,自引:1,他引:1
本文系统了基于规则的市场分析方法,结合随机性市场分析的特点,讨论了规则应具有的表达能力,引用X-表面式的概念,建立了归一化存储结构,提出了变量环境的概念,实现了合一过程,建造了一个基于规则的市场分析报告生成系统。 相似文献
44.
一个基于混合推理的故障智能诊断系统 总被引:5,自引:0,他引:5
首先介绍了用于某导弹系统二次电源故障智能诊断系统的总体框架 ,说明了各模块的功能及开发策略 ,然后介绍了该专家系统中模糊关系矩阵元素的获取方法和规则库的建立方法 ,阐述了模糊推理与规则推理相结合的混合诊断推理方法 ,最后给出了一个系统的运行实例。 相似文献
45.
多Markov链用户浏览预测模型 总被引:23,自引:0,他引:23
建立有效的用户浏览预测模型,对用户的浏览做出准确的预测,是开发各种浏览导航工具的关键.传统的Markoxr链模型是一种简单而有效的预测模型,但它存在预测准确率低,存储复杂度高等缺点.通过对该模型的扩展,该文提出并建立了一种基于用户分类的新模型——多Markov链模型.实验表明,该模型能更准确地描述用户在Web上的浏览特征,在预测准确率和存储复杂度方面都显著地优于传统的Markov链模型. 相似文献
46.
47.
自组织中文语义映射网络的优化特征编码方法 总被引:2,自引:0,他引:2
本文介绍自组织中文语义映射网络,并分别基于集合论、代数理论和概率论研究和提出六种不同的特征编码方法,这对自组织语义映射效果有很重要的影响。通过性能评价得出如下结论:使用TFIDF修正的频率密度编码能得到最佳效果,其语义映射的精确度和召回率分别为94.4%和90.7% ,而基于向量模型的方法则都不适用于中文自组织语义映射。文中给出结果分析。另外比较实验结果表明文中的最好方法其系统性能好于目前广泛采用的分层聚类技术,并远好于多元统计分析技术,例如主成分分析的特征降维编码。 相似文献
48.
基于链接描述文本及其上下文的Web信息检索 总被引:20,自引:0,他引:20
文档之间的超链接结构是Web信息检索和传统信息检索的最大区别之一,由此产生了基于超链接结构的检索技术。描述了链接描述文档的概念,并在此基础上研究链接文本(anchor text)及其上下文信息在检索中的作用。通过使用超过169万篇网页的大规模真实数据集以及TREC 2001提供的相关文档及评价方法进行测试,得到如下结论:首先,链接描述文档对网页主题的概括有高度的精确性,但是对网页内容的描述有极大的不完全性;其次,与传统检索方法相比,使用链接文本在已知网页定位的任务上能够使系统性能提高96%,但是链接文本及其上下文信息无法在未知信息查询任务上改善检索性能;最后,把基于链接描述文本的方法与传统方法相结合,能够在检索性能上提高近16%。 相似文献
49.
大作业的设置对学生深入理解课程内容,提高求解问题的能力具有很大的帮助。文章在笔者多年从事人工智能教学的基础上,探讨人工智能导论课的大作业设置问题,提出大作业应具备的基本条件,说明选择四子棋作为大作业的理由,给出四子棋大作业的评分规则,并对学生的大作业总体情况进行分析,验证选择四子棋作为大作业题目的合理性。 相似文献
50.