首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 935 毫秒
1.
探索了一种新的检索方式,代替了依赖人工经验输入关键字检索的传统方法。在检索特定领域信息时,通过相关样本集融合,提取出关键词集,通过调节样本集实现关键词集的柔性控制,以调控搜索空间与结果取向。该方法在一定程度上避免了人类经验的主观性、片面性和关键词任选偏差,可以使查全率与结果数量达到最佳协调,实现最优性价比。  相似文献   

2.
由于传统信息检索方法检索时间长,检索误差率高,研究基于Spark框架的图书馆文献信息检索方法。首先,预处理文献信息数据,结合信息相似度,提取特征数据集合中的敏感数据获得属性特征。其次,基于Spark框架批处理数据,训练待测样本进行目标跟踪,寻找最优解集。对信息的特征进行查询,提取其中的关键词并在已建立的文本索引结构上进行检索和融合,运用K-Means聚类方法对融合结果进行重新排序。采用布尔查询机制构造文献检索模型,将不同信息数据多重倒排文献进行索引从而完成信息检索。实验结果表明,运用该方法检索时间最短,误差率最低,完成图书馆文献信息检索方法的优化。  相似文献   

3.
分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略。检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成。使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模文本检索方法对相关文本在段落一级进行精确检索,其中为了提高检索的执行效率,在检索算法中引入了遗传算法;输出这些候选的段落序号。实验结果证明了这种方法的有效性和高效性。  相似文献   

4.
冯林  袁彬  孙焘  滕弘飞 《计算机工程》2006,32(18):208-210
为了提高图像检索的效率,近年来相关反馈机制被引入到基于内容的图像检索领域,而在基于内容的图像检索系统中,多特征融合检索中的特征加权又是一个重要的问题。该文提出了一种新的基于特征加权的相关反馈方法,在粗集理论的基础上,结合用户标记的反馈图像建立决策表,通过决策规则的精度来对多个特征加权,使图像检索和人的感知更加接近。实验表明该方法是有效的,并较Rui的相关反馈方法在性能上有很大提高。  相似文献   

5.
一种高效的并行频繁集挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张诤  王惠文 《计算机工程》2008,34(11):55-57,6
针对Apriori算法在挖掘超大规模数据集时存在的效率低下问题,在数据集分块和事务数据库布尔化映射基础上,提出一种直接利用布尔矩阵向量运算挖掘频繁集的并行频繁集挖掘算法(PFIM)。仿真实验分析表明,PFIM算法比Apriori算法的挖掘时间缩短了近90%,该方法可用于挖掘超大规模数据库,具有良好的并行性和可伸缩性。  相似文献   

6.
目的 针对基于内容的图像检索存在低层视觉特征与用户对图像理解的高层语义不一致、图像检索的精度较低以及传统的分类方法准确度低等问题,提出一种基于卷积神经网络和相关反馈支持向量机的遥感图像检索方法。方法 通过对比度受限直方图均衡化算法对遥感图像进行预处理,限制遥感图像噪声的放大,采用自学习能力良好的卷积神经网络对遥感图像进行多层神经网络的监督学习提取丰富的图像特征,并将支持向量机作为基分类器,根据测试样本数据到分类超平面的距离进行排序得到检索结果,最后采用相关反馈策略对检索结果进行重新调整。结果 在UC Merced Land-Use遥感图像数据集上进行图像检索实验,在mAP(mean average precision)精度指标上,当检索返回图像数为100时,本文方法比LSH(locality sensitive Hashing)方法提高了29.4%,比DSH(density sensitive Hashing)方法提高了37.2%,比EMR(efficient manifold ranking)方法提高了68.8%,比未添加反馈和训练集筛选的SVM(support vector machine)方法提高了3.5%,对于平均检索速度,本文方法比对比方法中mAP精度最高的方法提高了4倍,针对复杂的遥感图像数据,本文方法的检索效果较其他方法表现出色。结论 本文提出了一种以距离评价标准为核心的反馈策略,以提高检索精度,并采用多距离结合的Top-k排序方法合理筛选训练集,以提高检索速度,本文方法可以广泛应用于人脸识别和目标跟踪等领域,对提升检索性能具有重要意义。  相似文献   

7.
在研究图像检索基本理论基础上,提出基于主色提取和主色集扩充的图像检索算法,并运用基于BP网络的相关反馈方法提高算法性能,通过开发图像检索系统并进行检索实验,验证了算法的检索性能及BP网络相关反馈算法的有效性.  相似文献   

8.
关于提高文献的检索效率,在科技文献检索过程中,传统的基于关键词匹配的检索方法缺乏对知识的理解和处理,只能检索出包含关键词的文献,而不能检索出与关键词语义相似的文献,因而检索结果在查全率和查准率都无法满足检索者的要求.将模糊粗糙集理论引入信息检索当中,对信息检索模型的缺陷进行了改进.首先用传统的互信息函数计算标引词之间的语义关联权重,构建出模糊近似空间;然后用TF - IDF方法获得文档的模糊向量表示,在计算标引词重要度权重时,不但考虑了标引词出现的频度,还考虑位置因素,查询的模糊向量表示完全由用户的兴趣确定;最后用模糊近似空间对关键词进行概念扩展,挖掘出相似概念类,计算文档和查询模糊表示的上、下近似集,文档和查询的匹配不再是关键词匹配,而是利用布尔逻辑的合取、析取公式对上、下近似集进行模糊匹配,并返回按相似度值排序的检索结果.仿真测试表明,方法能提高科技文档检索的性能,能对科技文献进行概念意义上的检索.  相似文献   

9.
针对支持向量机在大规模数据集上的低效率,提出了基于约减支持向量机的相关反馈图像检索算法。首先采用约减支持向量机训练初始分类器,以该分类器作为检索模型,根据检索结果进行相关反馈,从而进行再检索。实验结果表明,随着反馈次数的增加,检索到的相关图像也会增加;另外相对传统的基于向量机的方法,数据集规模越大,基于约减支持向量机的算法在时间上的优势越明显。  相似文献   

10.
邱江涛  唐常杰  李庆 《软件学报》2013,24(4):798-809
在学术文献检索中,如果检索系统根据用户提交的查询返回相关领域的文献,并将文献按重要程度进行排序,可以帮助用户快速了解相关学术领域.提出一个面向领域的学术文献检索框架,结合引用网络分析和内容分析来发现并排序相关领域重要文献.该框架设计了一个评分函数进行检索,包含两个方面:(1)论文在所查询领域的重要性;(2)论文与该领域的相关性.首先研究了一个“社区核”发现算法,从引用网络上发现和查询领域相关的一个文献子集,并对论文计算重要性评分.设计了一种有监督非负矩阵分解算法,该算法使用确定的领域相关文献为先验知识对其他论文进行分类并给出一个评分,以确定论文和查询学术领域的相关性.在真实数据集和合成数据集上的实验,证实了方法的有效性.  相似文献   

11.
针对k-means算法过度依赖初始聚类中心、收敛速度慢等局限性及其在处理海量数据时存在的内存不足问题,提出一种新的针对大数据集的混合聚类算法super-k-means,将改进的基于超网络的高维数据聚类算法与k-means相结合,并经过MapReduce并行化后部署在Hadoop集群上运行。实验表明,该算法不仅在收敛性以及聚类精度两方面得到优化,其加速比和扩展性也有了大幅度的改善。  相似文献   

12.
频繁模式挖掘算法FP-growth算法需递归地生成大量的条件FP-树,且耗费大量存储空间和时间。为此,采用矩阵技术统计约束子树中的频繁项集和频繁项集的支持度,以进行数据挖掘。实验结果表明,该频繁模式挖掘算法是有效的,具有较高的时间效率及空间 效率。  相似文献   

13.
徐华 《计算机科学》2014,41(12):172-175
与传统的TSK模糊系统相比,改进的双层TSK模糊系统CTSK(Central TSK Fuzzy System)有如下优点:良好的可解释性、更好的鲁棒性、较强的逼近能力。但对于大样本或超大样本数据集,其时间复杂度和空间复杂度的开销都极大地限制了它的实用性。针对此不足,通过模糊系统融合中心约束型最小包含球(CCMEB)理论提出了CCMEB-CTSK(CCMEB-based CTSK)算法。该算法在继承CTSK优点的同时,又较好地实现了处理大样本和超大样本数据集的有效性和快速性。仿真实验研究分析了采用不同模糊规则数的CCMEB-CTSK的性能指标和运行时间的比较,以及训练样本不加噪声和加入噪声情况下CCMEB-CTSK泛化能力和鲁棒性能的测试。  相似文献   

14.
A similarity measure is a useful tool for determining the similarity between two objects. Although there are many different similarity measures among the intuitionistic fuzzy sets (IFSs) proposed in the literature, the Jaccard index has yet to be considered as way to define them. The Jaccard index is a statistic used for comparing the similarity and diversity of sample sets. In this study, we propose a new similarity measure for IFSs induced by the Jaccard index. According to our results, proposed similarity measures between IFSs based on the Jaccard index present better properties. Several examples are used to compare the proposed approach with several existing methods. Numerical results show that the proposed measures are more reasonable than these existing measures. On the other hand, measuring the similarity between IFSs is also important in clustering. Thus, we also propose a clustering procedure by combining the proposed similarity measure with a robust clustering method for analyzing IFS data sets. We also compare the proposed clustering procedure with two clustering methods for IFS data sets.  相似文献   

15.
用中国广东地区的DEM数据和ENVISAT-ASAR参数,按SAR成像机理和双尺度粗糙面散射计算构造SLC数据,通过按比例变更DEM的起伏程度造成具有不同的起伏高度和阴影,进而构造了多景不同残差点数量的相干数据。该数据能够有效的估评检验各种InSAR解缠算法,有助于分析实际图像阴影对InSAR反演DEM误差的影响。在路径跟踪的解缠算法中,路径越短解缠效果越好。提出了一种路径跟踪的相位解缠算法,其利用蚁群算法求解连接残差点的最短路径,然后对该路径进行了分割,生成连接相邻异性的残差点对的分割路径,能够在解缠过程中避免出现“解缠孤岛”现象。将该算法分别应用于多景仿真SLC数据的相干图像和ENVISAT-ASAR伊朗Bam地区的InSAR图像,并与其它几种解缠算法作了比较。数据实验结果表明:该算法可有效的应用于各种复杂地形的InSAR图像的相位解缠,与其它解缠方法相比,具有一定的优越性。  相似文献   

16.
针对目前国内中小型软件企业缺乏有效的项目量化管理方法的现状,本文建立了适合中小型软件企业的项目量化管理模型.首先通过选择关键性的11个CMM指标,并结合中小型软件企业的现状自定义了3个指标,从而形成指标体系.然后将形成的指标体系叠加到软件工程的瀑布模型上,形成适用于中小型软件企业的项目量化分析模型.此外,本文还使用该量化分析模型,对一个典型的中小型软件企业进行了应用性研究,实践结果表明本文提出的项目量化管理模型可有效提高中小型软件企业的项目管理水平.  相似文献   

17.
基于体素模型的优化体绘制技术   总被引:6,自引:0,他引:6  
直接体绘制技术因可绘制数据场中包含的内部结构形成较高图像质量而倍受青睐,但大量计算导致的绘制速度慢严重制约着其在大规模数据场交互绘制方面的应用。对现有算法进行优化是其发展方向之一。对目前基于体素模型的体绘制关键环节优化技术进行了概括,并分析了进行优化的主要思路,为进一步应用、改进这些技术提供参考。  相似文献   

18.
基于粗集和模糊集物流联盟知识共享风险预警   总被引:1,自引:1,他引:0       下载免费PDF全文
基于对有关物流联盟(虚拟物流)知识共享文献的综述,提出物流联盟知识共享风险预警评价指标体系。然后,利用粗糙集和模糊集的基本理论和方法,建立物流联盟知识共享风险预警模型,并给出基于分辨矩阵的指标属性约简算法,优化模型的评价指标。在此基础上,使用模糊集理论对物流联盟知识共享的风险进行评估。最后通过实例说明该预警模型的有效性及实用性。  相似文献   

19.
编制后控词表是实现智能查询的重要环节.针对建立"智能化建设法规政策知识库",重点研究通过后控词表实现智能化查询的方法.针对自然语言查询涉及政策法规和案例两类查询结果,从而设计了包含有两个主题词表,共6个词表的后控词表模式,分析词表关联关系,说明词表的词汇集合关系,并给出了基于此模式的智能查询算法,对大型文献智能知识库系统开发中后控词表的编制具有一定借鉴意义.  相似文献   

20.
近年来,集合模拟被频繁地运用于气候、数学、物理等领域。集合模拟数据通常具有多值、多变量、时变的属性,再加上其庞大的数据量,对这类数据的分析充满着挑战。集合模拟数据可视化,是通过视觉和人机交互的手段,向领域专家揭示集合模拟数据中的成员差异和整体概况,从而帮助专家探索、总结、和验证科学发现。本文从比较个体成员和概括整体成员这两个不同分析任务,以及基于位置和基于特征这两种分析策略的角度,系统地分析了具有代表性的集合模拟可视化工作,收集整理了各类方法的可视化形式、交互技术、应用案例。文章通过总结近年集合模拟可视化方法来讨论现有研究的趋势,以及对未来研究进行进一步的展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号