首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 71 毫秒
1.
维护代码和对应的文档的关联在软件维护、程序理解、需求跟踪等软件工程活动中有重要的意义。维护这些关联其关键在于提取关联信息,提出了一种利用信息检索技术自动提取程序源代码和中文文档关联信息的方法。首先通过提取文档中的词汇建立文档的语言概率模型,在此基础上用由代码信息组成的检索项检索文档集,由此得到代码和文档的相关列表和关联矩阵。测试结果表明在提取项大于5时即可获得95%以上的关联。  相似文献   

2.
基于文档实例的中文信息检索   总被引:2,自引:0,他引:2  
传统的信息检索系统基于关键词建立索引并进行信息检索.这些系统存在查询返回文档集大、准确率低和普通用户不便于构造查询等不足.为此,该文提出基于文档实例的信息检索,即以已有文档作为样本,在文档库中检索与样本文档相似的所有文档.文中给出了基于文档实例的中文信息检索的解决方法和实现技术.初步实验结果表明该方法是行之有效的.  相似文献   

3.
随着社交媒体的兴起,各种社交媒体服务应运而生,社交媒体多源化现象越来越明显。一种基于关联规则挖掘的方法可以用来分析研究社交媒体多源现象,即通过同一个用户与不同社交媒体上多源数据的行为交互,挖掘社交媒体多源数据知识关联,进而设计跨网络协同的视频推荐应用。本研究框架主要分为3个步骤:(1)基于主题建模的知识发现,对用户和视频进行主题建模,得到其在主题层上的表示;(2)基于关联规则挖掘的跨网络知识关联,以跨网络共同用户作为连接不同网络的桥梁,利用关联规则的方法挖掘不同网络间的知识关联;(3)基于跨网络知识发现的冷启动视频推荐,将用户和视频映射到同一主题空间并进行主题匹配,最终进行视频推荐。实验结果表明,通过跨网络用户协同,该跨网络知识关联方法能得到除了语义关联外更加灵活有效的跨网络关联,并在冷启动的跨网络视频推荐中取得较好的推荐效果。  相似文献   

4.
基于LSI的图像语义检索   总被引:1,自引:0,他引:1  
图像语义检索是实现图像快速、直观、准确查询的有效办法,针对目前直接采用图像低层特征无法满足图像语义查询的问题,该文提出了一种利用LSI技术,实现图像语义的检索方法。  相似文献   

5.
对搜索引擎用户的意图理解是信息检索领域的重要课题之一,其结果可直接影响检索到信息的符合度.由于实体名词在提交检索短语中通常可表达明确的语义信息,因此提出一种基于实体行为间语义关联分析的用户潜在行为意图挖掘方法,通过文法解析提取与实体名词在文法层相关的大量用户行为样本,构建行为样本池,并提出分析行为样本的显著性、代表性和多样性指标,用于样本池中潜在行为与实体检索语义关联程度排序,实现用户行为意图挖掘.基于NTCIR-13的AKG评测实验表明,该方法可根据实体检索词解析获得丰富且有效的用户潜在行为意图.  相似文献   

6.
对隐含语义索引模型在中文文本检索中的应用进行分析,证明了隐含语义索引模型通过挖掘文本和词汇之间的隐含关系较好地实现了语艾检索,指出所存在的问题和进一步研究的方向.  相似文献   

7.
隐含语义索引模型的分析与研究   总被引:4,自引:0,他引:4  
王春红  张敏 《计算机应用》2007,27(5):1283-1285
在深入分析向量空间模型基础上,对其进行扩展,设计了一种隐含语义索引模型——LSI。LSI通过奇异值分解,将词向量和文档向量投影到一个低维空间,消减了词和文档之间的语义模糊度。理论分析证明,隐含语义索引模型具有更准确的文档语义内容的表达能力,能够取得更好的检索效果。  相似文献   

8.
基于约束的关联规则挖掘是一种重要的关联挖掘,能按照用户给出的条件来实行有针对性的挖掘。大多数此类算法仅处理具有一种约束的挖掘,因而其应用受到一定程度的限制。提出一种新的基于约束的关联规则挖掘算法MCAL,它同时处理两种类型的约束:非单调性约束和单调性约束。算法包括3个步骤:第一步,挖掘当前数据集的频繁1项集;第二,应用约束的性质和有效剪枝策略来寻找约束点,同时生成频繁项的条件数据库;最后,递归地应用前面两步寻找条件数据库中频繁项的约束点,以生成满足约束的全部频繁项集。通过实验对比,无论从运行时间还是可扩展性来说,本算法均达到较好的效果。  相似文献   

9.
刘雨露 《计算机工程》2010,36(16):54-56
针对空间关联规则挖掘算法的冗余计算问题,提出一种基于序号索引的空间关联规则挖掘算法。该算法适用于挖掘单层横向空间的关联规则,在自底向上和自顶向下的搜索过程中,用定序操作产生序号索引,通过序号索引在双向挖掘过程中修剪重复候选项和删除冗余计算,以提高算法效率。实验结果证明该算法比现有的算法更快速有效。  相似文献   

10.
因果关联规则是知识库中一类重要的知识类型,具有重要的应用价值。首先对因果关系的特殊性质进行了分析,然后基于语言场和广义归纳逻辑因果模型,从表示、挖掘、评价和应用几方面,对因果关联规则的研究进行了详细论述。并在此基础上提出了隐含因果关联规则的概念。通过语言场和推理机制的运用,使因果关联规则这一重要知识形式的挖掘和评价过程具有良好的逻辑性和扩张性。  相似文献   

11.
正确建立软件文档与代码间的可追踪关系对程序理解、软件维护等非常重要。近年来,软件文档与代码间的可追踪性研究大多基于文本词汇相似度,没有充分利用软件文档和代码所蕴含的结构信息,针对这一问题提出了将软件结构信息与信息检索模型相结合进行文档与代码间可追踪性分析的方法。通过对文档和代码结构信息的分析,改善预处理效果,优化相似度计算过程,进而提高整体方法的有效性。实验结果表明,该方法比单纯基于信息检索的方法在查全率和查准率上都有所提高,而且能提取到更多的可追踪性链。  相似文献   

12.
本文针对当前传统潜在语义索引(LSI——latent semantic indexing)技术在提供信息过滤服务时已经不能满足用户个性化需求这一实际情况,提出利用隐式反馈技术来解决如何提供给不同用户以不同信息结果这一问题。在传统的LSI技术上提出了一种基于隐式反馈的LSI个性化信息过滤方法,该方法通过引入隐式反馈技术,将其应用于信息过滤中,从而可以为不同用户提供更多更有针对性的信息结果。本文给出了该方法的公式和具体算法,为其应用的实现提供了理论基础。  相似文献   

13.
基于LSI和SVM分类法的定题邮件过滤研究   总被引:1,自引:0,他引:1  
潜在语义索引(LSI)是一种有效的信息查询方法,同时也被成功地应用到了文本分类中。LSI能解决同义和多义的问题,通过降低原始文档-术语矩阵的噪声来凸现出词条和文档之间的语义关系。为了识别和过滤有害的、不期望的定题的信息或Email,在双语言环境下(包括中文和英文),提出了一个基于改进的LSI方法的定题邮件类信息过滤系统,该系统采用潜在语义模型来表示被过滤的信息类,通过奇异值分解和正例监护学习方法,选择支持向量机(SVM)来识别和分类预定义的定题信息。实验结果表明:基于LSI的特征选择的SVM分类算法是一种更有效的信息识别和文本分类方法,不但具有较好的分类性能,同时也能大大减小计算的复杂性。  相似文献   

14.
文中采用了一种协同进化算法,分别利用改进的遗传算法和粒子群算法对两个种群同时进行迭代,并在种群之间引入一种信息交互机制,使两个种群协同进化。文中最后通过实验对该协同进化算法、传统的遗传算法以及粒子群算法应用于关联规则挖掘时的性能进行比较,证明了该协同进化算法在可接受的时间复杂度前提下,不仅继承了传统遗传算法挖掘关联规则时无须产生规模庞大的候选项集和有效减少扫描数据库次数的优点,更弥补了其容易早熟收敛的缺陷,从而能高效地搜索出数据库中高质量的关联规则,这点在其应用于高维数据集时尤为显著。  相似文献   

15.
基于潜在语义标引的WEB文档自动分类   总被引:7,自引:1,他引:6  
Web挖掘技术在商业上有广泛的应用前景,但现有的Web挖掘技术存在计算量大,精度不高等问题。论文提出的LSIWAC算法,首先运用潜在语义标引技术将Web页面词空间压缩到低维的特征空间;然后,在得到的特征空间上运用最优聚类将样本集合分为若干簇;对得到的每簇鉴别特征再利用最佳鉴别变换进行压缩和特征抽取,并用最终得到的特征矢量进行分类。该方法克服了样本高维效应,有效提高分类准确率,降低计算量。实验结果验证所提方法的有效性。  相似文献   

16.
论文先介绍数据挖掘中关联规则理论知识,包括Apriori经典算法、支持度、可信度等概念。以一个超市的销售模型系统为例,建立一个sales数据库系统,由关系数据库管理系统和数据仓库挖掘工具进行单维及多维关联规则挖掘。  相似文献   

17.
采用无线射频识别技术(Radio Frequency Identification,RFID)、无线数据通信技术(GPRS)、网络技术及数据库技术等,构建食品安全监测追溯系统。该系统可以对食品从生产养殖、出场、流通批发到零售环节等进行全过程跟踪、追溯,实现食品的安全监测管理。  相似文献   

18.
简单数据集可以通过关联规则得到在数据间的相互关系;相当多的情况下,由于不能从关联规则得到隐藏在数据间的相互关系,需要按间接关联规则分析出数据项集在交易集合中出现的频度,挖掘隐藏在数据间的相互关系。文中通过使用概念分层和基于近邻的方法,探讨利用FP树产生的频繁项集,对候选关联检验其是否满足项对支持度条件,并利用这个频繁项集挖掘事务的间接关联,找到挖掘事务的间接关联的内在规律,构造出不依赖中介条件的间接关联挖掘算法。  相似文献   

19.
首先介绍了关联规则的基本概念,然后详细地介绍了Apriori算法,同时也指出了Apriori算法的一些不足。针对这些不足提出了解决方法,描述了几种优化算法。最后对关联规则研究范围进行了拓展。  相似文献   

20.
介绍了Web挖掘的基本概念和分类,通过关联规则对Web使用数据进行深层次的分析,从而挖掘出有意义的模式及规则,以利于设计Web站点时,将关联的产品进行捆绑销售.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号