共查询到20条相似文献,搜索用时 935 毫秒
1.
2.
由于传统信息检索方法检索时间长,检索误差率高,研究基于Spark框架的图书馆文献信息检索方法。首先,预处理文献信息数据,结合信息相似度,提取特征数据集合中的敏感数据获得属性特征。其次,基于Spark框架批处理数据,训练待测样本进行目标跟踪,寻找最优解集。对信息的特征进行查询,提取其中的关键词并在已建立的文本索引结构上进行检索和融合,运用K-Means聚类方法对融合结果进行重新排序。采用布尔查询机制构造文献检索模型,将不同信息数据多重倒排文献进行索引从而完成信息检索。实验结果表明,运用该方法检索时间最短,误差率最低,完成图书馆文献信息检索方法的优化。 相似文献
3.
金小峰 《计算机工程与应用》2011,47(7):143-145
分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略。检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成。使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模文本检索方法对相关文本在段落一级进行精确检索,其中为了提高检索的执行效率,在检索算法中引入了遗传算法;输出这些候选的段落序号。实验结果证明了这种方法的有效性和高效性。 相似文献
4.
5.
6.
目的 针对基于内容的图像检索存在低层视觉特征与用户对图像理解的高层语义不一致、图像检索的精度较低以及传统的分类方法准确度低等问题,提出一种基于卷积神经网络和相关反馈支持向量机的遥感图像检索方法。方法 通过对比度受限直方图均衡化算法对遥感图像进行预处理,限制遥感图像噪声的放大,采用自学习能力良好的卷积神经网络对遥感图像进行多层神经网络的监督学习提取丰富的图像特征,并将支持向量机作为基分类器,根据测试样本数据到分类超平面的距离进行排序得到检索结果,最后采用相关反馈策略对检索结果进行重新调整。结果 在UC Merced Land-Use遥感图像数据集上进行图像检索实验,在mAP(mean average precision)精度指标上,当检索返回图像数为100时,本文方法比LSH(locality sensitive Hashing)方法提高了29.4%,比DSH(density sensitive Hashing)方法提高了37.2%,比EMR(efficient manifold ranking)方法提高了68.8%,比未添加反馈和训练集筛选的SVM(support vector machine)方法提高了3.5%,对于平均检索速度,本文方法比对比方法中mAP精度最高的方法提高了4倍,针对复杂的遥感图像数据,本文方法的检索效果较其他方法表现出色。结论 本文提出了一种以距离评价标准为核心的反馈策略,以提高检索精度,并采用多距离结合的Top-k排序方法合理筛选训练集,以提高检索速度,本文方法可以广泛应用于人脸识别和目标跟踪等领域,对提升检索性能具有重要意义。 相似文献
7.
在研究图像检索基本理论基础上,提出基于主色提取和主色集扩充的图像检索算法,并运用基于BP网络的相关反馈方法提高算法性能,通过开发图像检索系统并进行检索实验,验证了算法的检索性能及BP网络相关反馈算法的有效性. 相似文献
8.
关于提高文献的检索效率,在科技文献检索过程中,传统的基于关键词匹配的检索方法缺乏对知识的理解和处理,只能检索出包含关键词的文献,而不能检索出与关键词语义相似的文献,因而检索结果在查全率和查准率都无法满足检索者的要求.将模糊粗糙集理论引入信息检索当中,对信息检索模型的缺陷进行了改进.首先用传统的互信息函数计算标引词之间的语义关联权重,构建出模糊近似空间;然后用TF - IDF方法获得文档的模糊向量表示,在计算标引词重要度权重时,不但考虑了标引词出现的频度,还考虑位置因素,查询的模糊向量表示完全由用户的兴趣确定;最后用模糊近似空间对关键词进行概念扩展,挖掘出相似概念类,计算文档和查询模糊表示的上、下近似集,文档和查询的匹配不再是关键词匹配,而是利用布尔逻辑的合取、析取公式对上、下近似集进行模糊匹配,并返回按相似度值排序的检索结果.仿真测试表明,方法能提高科技文档检索的性能,能对科技文献进行概念意义上的检索. 相似文献
9.
针对支持向量机在大规模数据集上的低效率,提出了基于约减支持向量机的相关反馈图像检索算法。首先采用约减支持向量机训练初始分类器,以该分类器作为检索模型,根据检索结果进行相关反馈,从而进行再检索。实验结果表明,随着反馈次数的增加,检索到的相关图像也会增加;另外相对传统的基于向量机的方法,数据集规模越大,基于约减支持向量机的算法在时间上的优势越明显。 相似文献
10.
在学术文献检索中,如果检索系统根据用户提交的查询返回相关领域的文献,并将文献按重要程度进行排序,可以帮助用户快速了解相关学术领域.提出一个面向领域的学术文献检索框架,结合引用网络分析和内容分析来发现并排序相关领域重要文献.该框架设计了一个评分函数进行检索,包含两个方面:(1)论文在所查询领域的重要性;(2)论文与该领域的相关性.首先研究了一个“社区核”发现算法,从引用网络上发现和查询领域相关的一个文献子集,并对论文计算重要性评分.设计了一种有监督非负矩阵分解算法,该算法使用确定的领域相关文献为先验知识对其他论文进行分类并给出一个评分,以确定论文和查询学术领域的相关性.在真实数据集和合成数据集上的实验,证实了方法的有效性. 相似文献
11.
针对k-means算法过度依赖初始聚类中心、收敛速度慢等局限性及其在处理海量数据时存在的内存不足问题,提出一种新的针对大数据集的混合聚类算法super-k-means,将改进的基于超网络的高维数据聚类算法与k-means相结合,并经过MapReduce并行化后部署在Hadoop集群上运行。实验表明,该算法不仅在收敛性以及聚类精度两方面得到优化,其加速比和扩展性也有了大幅度的改善。 相似文献
12.
13.
与传统的TSK模糊系统相比,改进的双层TSK模糊系统CTSK(Central TSK Fuzzy System)有如下优点:良好的可解释性、更好的鲁棒性、较强的逼近能力。但对于大样本或超大样本数据集,其时间复杂度和空间复杂度的开销都极大地限制了它的实用性。针对此不足,通过模糊系统融合中心约束型最小包含球(CCMEB)理论提出了CCMEB-CTSK(CCMEB-based CTSK)算法。该算法在继承CTSK优点的同时,又较好地实现了处理大样本和超大样本数据集的有效性和快速性。仿真实验研究分析了采用不同模糊规则数的CCMEB-CTSK的性能指标和运行时间的比较,以及训练样本不加噪声和加入噪声情况下CCMEB-CTSK泛化能力和鲁棒性能的测试。 相似文献
14.
New similarity measures of intuitionistic fuzzy sets based on the Jaccard index with its application to clustering
下载免费PDF全文
![点击此处可从《国际智能系统杂志》网站下载免费的PDF全文](/ch/ext_images/free.gif)
A similarity measure is a useful tool for determining the similarity between two objects. Although there are many different similarity measures among the intuitionistic fuzzy sets (IFSs) proposed in the literature, the Jaccard index has yet to be considered as way to define them. The Jaccard index is a statistic used for comparing the similarity and diversity of sample sets. In this study, we propose a new similarity measure for IFSs induced by the Jaccard index. According to our results, proposed similarity measures between IFSs based on the Jaccard index present better properties. Several examples are used to compare the proposed approach with several existing methods. Numerical results show that the proposed measures are more reasonable than these existing measures. On the other hand, measuring the similarity between IFSs is also important in clustering. Thus, we also propose a clustering procedure by combining the proposed similarity measure with a robust clustering method for analyzing IFS data sets. We also compare the proposed clustering procedure with two clustering methods for IFS data sets. 相似文献
15.
用中国广东地区的DEM数据和ENVISAT-ASAR参数,按SAR成像机理和双尺度粗糙面散射计算构造SLC数据,通过按比例变更DEM的起伏程度造成具有不同的起伏高度和阴影,进而构造了多景不同残差点数量的相干数据。该数据能够有效的估评检验各种InSAR解缠算法,有助于分析实际图像阴影对InSAR反演DEM误差的影响。在路径跟踪的解缠算法中,路径越短解缠效果越好。提出了一种路径跟踪的相位解缠算法,其利用蚁群算法求解连接残差点的最短路径,然后对该路径进行了分割,生成连接相邻异性的残差点对的分割路径,能够在解缠过程中避免出现“解缠孤岛”现象。将该算法分别应用于多景仿真SLC数据的相干图像和ENVISAT-ASAR伊朗Bam地区的InSAR图像,并与其它几种解缠算法作了比较。数据实验结果表明:该算法可有效的应用于各种复杂地形的InSAR图像的相位解缠,与其它解缠方法相比,具有一定的优越性。 相似文献
16.
针对目前国内中小型软件企业缺乏有效的项目量化管理方法的现状,本文建立了适合中小型软件企业的项目量化管理模型.首先通过选择关键性的11个CMM指标,并结合中小型软件企业的现状自定义了3个指标,从而形成指标体系.然后将形成的指标体系叠加到软件工程的瀑布模型上,形成适用于中小型软件企业的项目量化分析模型.此外,本文还使用该量化分析模型,对一个典型的中小型软件企业进行了应用性研究,实践结果表明本文提出的项目量化管理模型可有效提高中小型软件企业的项目管理水平. 相似文献
17.
18.
基于对有关物流联盟(虚拟物流)知识共享文献的综述,提出物流联盟知识共享风险预警评价指标体系。然后,利用粗糙集和模糊集的基本理论和方法,建立物流联盟知识共享风险预警模型,并给出基于分辨矩阵的指标属性约简算法,优化模型的评价指标。在此基础上,使用模糊集理论对物流联盟知识共享的风险进行评估。最后通过实例说明该预警模型的有效性及实用性。 相似文献
19.
编制后控词表是实现智能查询的重要环节.针对建立"智能化建设法规政策知识库",重点研究通过后控词表实现智能化查询的方法.针对自然语言查询涉及政策法规和案例两类查询结果,从而设计了包含有两个主题词表,共6个词表的后控词表模式,分析词表关联关系,说明词表的词汇集合关系,并给出了基于此模式的智能查询算法,对大型文献智能知识库系统开发中后控词表的编制具有一定借鉴意义. 相似文献
20.
近年来,集合模拟被频繁地运用于气候、数学、物理等领域。集合模拟数据通常具有多值、多变量、时变的属性,再加上其庞大的数据量,对这类数据的分析充满着挑战。集合模拟数据可视化,是通过视觉和人机交互的手段,向领域专家揭示集合模拟数据中的成员差异和整体概况,从而帮助专家探索、总结、和验证科学发现。本文从比较个体成员和概括整体成员这两个不同分析任务,以及基于位置和基于特征这两种分析策略的角度,系统地分析了具有代表性的集合模拟可视化工作,收集整理了各类方法的可视化形式、交互技术、应用案例。文章通过总结近年集合模拟可视化方法来讨论现有研究的趋势,以及对未来研究进行进一步的展望。 相似文献