首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
韩如冰  叶得学 《软件》2012,33(10):103-105
向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索的效果起着决定性的作用.文中提出了一个基于关键词的权重改进传统向量空间模型的权重算法.基于改进索引项权重的向量空间模型除了考虑原有索引项权重还考虑了文档中关键词的权重.通过特定领域FAQ的检索测试结果表明,改进的算法很大程度上提高了检索的查准率、查全率.  相似文献   

2.
向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索等的效果起着重要的作用。文中使用了一个基于关键词的权重,并利用它改进传统向量空间模型的权重算法。改进后的模型综合考虑原有索引项权重和文档中关键词的权重。在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率。  相似文献   

3.
向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索等的效果起着重要的作用。文中使用了一个基于关键词的权重,并利用它改进传统向量空间模型的权重算法。改进后的模型综合考虑原有索引项权重和文档中关键词的权重。在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率。  相似文献   

4.
随着WEB上图片资源的日益丰富,人们对WEB图片检索的需求也日趋强烈。基于文本的WEB图片检索技术,是人们当前检索WEB图片的主要手段。反映图片内容的各相关文字的重要性是不同的,需要通过一个词条的权重模式来确定什么词条对反映图片内容更重要。在现有的WEB图片检索系统中,对影响词条权重的因素考虑不够,权重模式较粗糙。文章在词条权重的研究中,更广泛地考虑了影响权重的因素,提出了一个“综合权重模式”,并通过数学语言予以精确描述。  相似文献   

5.
潜在语义分析权重计算的改进   总被引:12,自引:0,他引:12  
自从潜在语义分析方法诞生以来,被广泛应用于信息检索、文本分类、自动问答系统等领域中。潜在语义分析的一个重要过程是对词语文档矩阵作加权转换,加权函数直接影响潜在语义分析结果的优劣。本文首先总结了传统的、已成熟的权重计算方法,包括局部权重部分和词语全局权重部分,随后指出已有方法的不足之处,并对权重计算方法进行扩展,提出文档全局权重的概念。在最后的实验中,提出了一种新的检验潜在语义分析结果优劣的方法———文档自检索矩阵,实验结果证明改进后的权重计算方法提高了检索效率。  相似文献   

6.
王景中  邱铜相 《计算机应用》2015,35(10):2901-2904
针对传统的TF-IDF算法、K-means算法、自适应遗传算法在网络检索结果中含有大量不相关数据、语义检索准确性不高的问题,研究了TF-IDF算法的改进及其在语义检索中的应用。将正则表达式和语义分析技术相结合,从而实现对TF-IDF算法的改进。利用语义库对搜索主题进行描述,根据正则原子语义的重要性和在网页标签中的不同位置进行加权计算,得到正则原子在文档中的相似度。通过空间向量模型对文档相似度和主题模型进行余弦运算,从而获取最终的搜索结果。最后,将改进的TF-IDF算法、传统的TF-IDF算法、K-means算法和自适应遗传算法运用于聚焦主题网络爬虫中,对其检索结果进行了对比分析。计算结果表明,在聚焦主题网络爬虫语义分析的垂直搜索中,改进TF-IDF算法的相似度准确率比传统的TF-IDF算法检索准确率提高了17.1个百分点,遗漏率降低了7.76个百分点;比K-means算法检索准确率提高6个百分点;比自适应遗传算法检索准确率提高了8.1个百分点。总之,改进的TF-IDF算法可以有效地提高文档相似度检测的准确率,很好地改善聚焦主题网络爬虫在语义分析中的缺陷。  相似文献   

7.
基于改进VSM的句子相似度研究   总被引:1,自引:0,他引:1  
向量空间模型是以特征项权重为核心的算法,特征项权重对文本分类、检索等的效果起着至关重要的作用.文中提出了一个新的权重概念--领域权重,并利用它改进传统向量空间模型.改进后的模型综合考虑原有特征项权重和文档中特征项自身的领域权重.在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率和F测试值.  相似文献   

8.
语义检索是解决信息检索中准确度、人性化要求的一个非常有潜力的方法。通过对知识文档进行主题词标注,然后建立从词元→主题词→知识文档的二级索引结构;对用户的检索,进行查询词到主题词的转化,计算语义相似度,按照语义相似度算法进行排序文档。目前基于知识文档的语义检索系统已经在某集团公司进行部署和应用,取得了前5项结果命中用户总查询90%的效果,说明这种方法是语义检索的一种有效途径。  相似文献   

9.
基于改进TFIDF算法的文本分类研究   总被引:1,自引:0,他引:1  
由于文本分类在信息检索、邮件过滤、网页分类、个性化推荐等领域有着广泛的应用价值,所以自文本分类的概念提出以来,受到了学者们的广泛关注。在文本分类的研究中,学者们运用了很多方法,其中TFIDF是文档特征权重计算的最常用算法之一,但是传统的TFID算法忽略了特征项在类内和类间的分布,导致很多区分度不大的特征项被赋予了较大的权重。针对传统TFIDF算法的不足,本文在IDF的计算过程中,用词条在类内与类间的文档占比来考虑词条在类内与类间的分布。在实验中,用改进的权重算法表示文本向量,通过考察分类的效果,验证了改进算法的有效性。  相似文献   

10.
综合文档语义与用户查询语义的XML关键字检索   总被引:1,自引:0,他引:1  
黎军  熊海灵 《计算机应用》2010,30(11):2945-2948
为了解决XML关键字查询中语义信息丢失的问题,提出了一种语义相关的关键字检索方法。利用文档的半结构化特点提取文档隐含的语义,利用查询语法捕获用户查询意图,然后根据用户意图查询满足条件的元素,并结合文档语义,由最小最近公共祖先改进为语义相关实体子树集来表达查询结果。实验结果表明,该方法能够有效提高关键字检索结果的查准率。  相似文献   

11.
采用最子化学从头算方法在HF/6-311+G(d)水平上计算8种烷基酚类化合物的分子结构描述符,选用修正过的CP统计量为目标函和新蚁群优化算法,于烷基酚类化合物的定量结构--活性相关研究中的变量选择,建立烷基酚类化合物的生物降解速率常数与其量化参数之间的QSAR模型.结果表明,新蚁群优化算法用于定量构效中的变量选择比较简单,而且需要调节的参数少,是变量选择的有用方法,且应用量子化学结构参数建模的相关系数R=0.994,与文献中R=0.982相比相关性更好.  相似文献   

12.
We present a bundle algorithm for multiple-instance classification and ranking. These frameworks yield improved models on many problems possessing special structure. Multiple-instance loss functions are typically nonsmooth and nonconvex, and current algorithms convert these to smooth nonconvex optimization problems that are solved iteratively. Inspired by the latest linear-time subgradient-based methods for support vector machines, we optimize the objective directly using a nonconvex bundle method. Computational results show this method is linearly scalable, while not sacrificing generalization accuracy, permitting modeling on new and larger data sets in computational chemistry and other applications. This new implementation facilitates modeling with kernels.  相似文献   

13.
R2空间上分布数据的多重分形维数谱计算和分形特征提取   总被引:1,自引:0,他引:1  
近年来多重分形的概念在物理、化学等领域得到了发展和应用 ,在这些领域中 ,这种方法显示出了对于研究物理和化学量的空间分布是很有用的 .多重分形谱的计算是其中重要而又较难处理的问题 .从多重分形的理论出发 ,讨论了在数据处理的实际工作中有广泛应用的二维空间中多重分形谱的计算及分形特征提取的算法 ,介绍了算法的数学原理 ,描述了完整的算法流程 ,并给出了此算法的一个计算实例  相似文献   

14.
无限制二维下料问题的改进动态规划算法   总被引:4,自引:0,他引:4  
本文给出了一种求解无限制板材下料问题的动态规划解法,对该算法的计算复杂度 进行了分析.并针对算法的特点提出了改进方案.通过理论分析得到改进方案的适用范围, 并描述了这一改进动态规划算法的应用前景.数值实验表明,该算法可以缩简传统动态规划 算法的计算时间和空间,同时得到解的最优值.  相似文献   

15.
为了提高传统DV-Hop算法的定位精度,推动该算法的进一步发展,文中从平均跳距计算和未知节点坐标计算两个阶段入手对传统DV-Hop算法进行改进,提出了一种基于RSSI加权修正的平均跳距计算方法和一种基于最小二乘法修正的未知节点坐标计算方法。为了验证算法改进的有效性,在Matlab中进行了仿真实验。实验结果表明:文中算法相对于传统DV-Hop算法测距精度提高了约20%;定位精度较传统DV-Hop算法提高了约30%。理论和实践均表明:在同等条件下文中的改进算法与传统DV-Hop算法相比具有更高的定位精度。  相似文献   

16.
针对经典K-means聚类算法存在易陷入局部最优解的缺点,提出并实现了一种基于Hadoop的改进型遗传聚类算法.该算法利用遗传算法具有全局性和并行性的特点去处理K-means聚类算法易陷入局部最优的缺点,在此基础上对遗传算法进行改进,然后将改进后的遗传算法与K-means算法相结合,为提高算法执行效率,将其基于Hadoop平台进行了实现.通过实验将该改进方法与经典聚类算法进行对比分析,实验结果表明该方法在聚类准确性和聚类效率上均有较大的提高.  相似文献   

17.
自主地面车辆在障碍物环境下的运动规划问题是一个包含非完整约束条件的全局优化问题。针对该优化问题,提出了一种基于参数化运动模型和改进粒子群优化算法的运动规划方法。该方法将车辆运动模型解耦为参数化弧长-曲率模型和速度模型,并采用混沌映射方法对粒子群优化算法进行了改进,将改进的粒子群优化算法应用于弧长-曲率模型中的参数优化问题。仿真结果证明了该方法的有效性,是自主地面车辆运动规划的一种较好方法。  相似文献   

18.
针对传统二维Otsu算法计算复杂度高的问题,提出一种改进的Otsu图像分割算法。该算法通过求两个一维Otsu法的阈值来代替传统二维Otsu法的阈值,使得计算复杂度得到了降低;同时为了改进分割效果,结合使用了模糊C-均值聚类算法。实验结果表明,改进的算法充分发挥了两者的优势,不仅在计算速度上优于原二维Otsu算法,且分割效果较好。  相似文献   

19.
基于神经网络模式的PID控制是PID控制规律与神经网络的动态结合,本文分析了此控制的局限性,并提出了改进算法,扩大了此控制的适用范围。用Matlab软件对改进的算法进行仿真,结果证明改进的算法有很好的收敛效果,从实验上验证了算法的有效性。  相似文献   

20.
王辉 《微机发展》2006,16(7):13-14
BP算法是目前应用极为广泛的神经网络算法,但它也存在一些不足。文中提出了一种使BP网络结构简化的改进的BP算法,它使得网络的速度得到了提高,减少了迭代次数。最后将传统的BP算法和改进的BP算法进行了比较,仿真结果表明改进的算法在学习次数和收敛速度上比传统的算法有很大的改善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号