首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 578 毫秒

1.  基于多开发者社区的用户推荐算法  
   时宇岑  印莹  赵宇海  张斌  王国仁《软件学报》,2019年第30卷第5期
   随着互联网技术的迅猛发展,基于开发者社区的提问-回答经验交流方式已成为众多开发人员解决软件开发、维护过程中所遇问题的重要手段之一.如何为开发者社区中的提问者及时、准确地推荐问题回答者,是具有实际需求的重要问题.通过对Stack Overflow和Github两个具有代表性的主流开发者社区相关数据的收集和分析,观察到影响上述问题推荐准确性和反馈及时性的3个现象:(1)用户标签自定现象,即开发者社区中,用户的标签信息是由用户自己主观定义所得,而非系统根据用户的历史行为客观标定;(2)不对称活跃现象,即用户可能在某个或某些开发者社区中活跃,但在其他社区中并不具有同等活跃程度,甚至不活跃;(3)关键词集封闭现象,即开发者社区中的问题回答者推荐仅依据问题文本中的关键词,而未考虑其他语义相关的关键词.针对以上问题,融合开发者社区的用户信息,通过分析用户与用户之间的互动行为,建立跨社区的开发者网络,并提出一种基于重启随机游走的算法更新用户标签.进一步地,通过使用Taxonomy来扩充问题的查询关键词范围,在此基础上,协同用户矩阵进行更加准确的推荐,并增大了推荐时有效用户的范围.收集的实验数据包括170万个有效主题、累计40万用户以及117个标签.实验结果证实,所提出的算法具有较好的F-measure和NDCG度量.特别是在冷门标签的推荐中,与未采用该方法的推荐算法相比,基于NDCG度量的推荐准确率至少可提高2倍,部分甚至可高达4倍.    

2.  基于多策略的文档信息过滤技术的应用研究  
   杨陟卓  韩燮《计算机工程与设计》,2009年第30卷第5期
   为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法.该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进的TFIDF对候选词的特征进行加权合成,去除不符合条件词,求出用户需求向量和待过滤文档向量的相似度,将相似度大于一定阈值的文档提供给用户.从实验参数确定、策略对结果的影响两方面论证了文档信息过滤算法的可行性.实验结果表明,基于多策略的文档信息过滤算法能够提高信息检索的查准率,改善信息检索的质量.    

3.  基于领域本体的文本分割方法研究  
   刘耀  帅远华  龚幸伟  黄毅《计算机科学》,2018年第45卷第1期
   文本分割在信息检索、摘要生成、问答系统、信息抽取等领域发挥着重要作用。在总结现有的国内外文本分割方法的基础上,提出了一种基于领域本体对文本进行线性分割的方法。该方法利用初始概念自动获取结构化语义概念集合,并根据获取的概念、属性及属性词在文本中出现的频次、位置和关系等因素为段落赋予语义标签,挖掘文本的子主题信息,将拥有相同语义标注信息的段落划分为相同语义段落,实现了文本不同子主题之间的分割。实验结果表明,该方法对于特定领域的文本分割的准确率、召回率以及F值分别达到了85%,90%和88%,分割效果能够满足实际应用需求,并优于现有的无需训练语料的文本分割方法。    

4.  使用抽象语法树和静态分析的克隆代码自动重构方法  被引次数:4
   于冬琦  彭鑫  赵文耘《小型微型计算机系统》,2009年第30卷第9期
   单个软件系统中以及若干个相似系统之间的代码克隆给软件维护增加了很大困难.本文针对运用克隆侦测发现的相似代码片断,提出一种基于抽象语法树和静态分析的代码自动重构方法.该方法首先为克隆代码分别构造抽象语法树,然后运用语句差异度指标建立起语法树之间流程控制语句的对应关系.在此基础上,该方法根据控制流程和基本语句块两个层次上的差异性分析,最终通过代码可变点提取实现克隆代码的自动合并.针对Java代码开发了克隆代码重构支持工具原型,并分别针对JDK1.5和一个业务系统进行了自动重构实验.初步的结果表明,该方法能够准确、有效地辅助开发者实现克隆代码的自动重构.    

5.  基于本体实现有效Web信息检索  
   郭猛  冯志勇《微处理机》,2007年第28卷第4期
   基于关键词处理的传统检索技术会在检索过程中遗漏大量与检索概念相关或同义的内容。针对这种情况,提出了一种基于本体的Web信息检索模型。另外该模型通过解析语义文档并分析所需的概念属性之间的关系得到一定的相似度,并在检索过程中利用该相似度进行语义扩展。    

6.  结合词义的文本特征词权重计算方法  
   李明涛  罗军勇  尹美娟  路林《计算机应用》,2012年第32卷第5期
   传统的基于向量空间模型的文本相似度计算方法,用TF-IDF计算文本特征词的权重,忽略了特征词之间的词义相似关系,不能准确地反映文本之间的相似程度.针对此问题,提出了结合词义的文本特征词权重计算方法,基于Chinese WordNet采用词义向量余弦计算特征词的词义相似度,根据词义相似度对特征词的TF-IDF权重进行修正,修正后的权重同时兼顾词频和词义信息.在哈尔滨工业大学信息检索研究室多文档自动文摘语料库上的实验结果表明,根据修正后的特征词权重计算文本相似度,能够有效地提高文本的类区分度.    

7.  结合影像和文本信息的医学病例检索  
   《计算机辅助设计与图形学学报》,2014年第9期
   针对计算机辅助诊断中的相似病例查找,提出一种基于多图半监督学习模型的多模态信息检索算法.首先将医学影像和文本视为互为补偿的不同模态的信息,根据2种信息分别构建图模型,并定义多图融合的半监督学习框架;然后在融合图上进行流形排序,得到最终的病例检索结果.在乳腺X线影像数据库和肺部CT影像数据库上的实验结果表明,该算法能够有效地利用影像和文本信息进行病例检索,具有更好的检索性能.    

8.  基于软件结构的文档与代码间可追踪性研究  
   杨丙贤  刘超《计算机科学与探索》,2014年第6期
   正确建立软件文档与代码间的可追踪关系对程序理解、软件维护等非常重要。近年来,软件文档与代码间的可追踪性研究大多基于文本词汇相似度,没有充分利用软件文档和代码所蕴含的结构信息,针对这一问题提出了将软件结构信息与信息检索模型相结合进行文档与代码间可追踪性分析的方法。通过对文档和代码结构信息的分析,改善预处理效果,优化相似度计算过程,进而提高整体方法的有效性。实验结果表明,该方法比单纯基于信息检索的方法在查全率和查准率上都有所提高,而且能提取到更多的可追踪性链。    

9.  一种基于句法分析的跟踪关系恢复方法  
   王金水  翁伟  彭鑫《计算机研究与发展》,2015年第3期
   软件需求跟踪已被公认为影响软件项目成败的一个关键因素。针对大多数基于信息检索的需求跟踪方法都严重依赖于软件制品中的文本质量,提出了一种基于句法分析的动态需求跟踪方法。该方法能够从制品中抽取最有可能刻画自身特征的标引词,并减少制品中噪音对需求跟踪带来的不利影响。为了验证该方法的有效性,在多个来自不同项目且类型不同的软件制品上,比较了基于不同标引词集合的动态需求跟踪方法所建立的跟踪关系。实验结果表明,基于句法分析的动态需求跟踪方法能够有效地提高跟踪关系的准确性。    

10.  基于本体视图特征项抽取方法研究*  
   肖升  胡金柱  姚双云  舒江波《计算机应用研究》,2010年第27卷第1期
   为提供比单纯词汇信息更高效的概念特征信息和深层语义信息,并满足面向同一文本的多检索需求,在半自动化智能检索框架中引入本体视图,提出一种基于本体视图的特征项抽取方法。此方法首先针对文本特征建立本体视图;然后结合文本信息进行特征项抽取和类型映射,得到特征项集;最后基于特征项集完成检索过程。检索结果显示,基于本体视图特征项抽取方法能改善检索系统的性能,提高检索的准确率和效率。    

11.  基于KDD的文本特征抽取模型  
   史雯《山西电子技术》,2013年第1期
   针对目前数据库知识发现模型系统中传统文本信息抽取算法无法满足用户业务需求的问题,提出了一种基于用户需求描述的文本信息特征抽取模型。通过用户的业务需求模型进行特征化描述,将数据库中存储的原始本文信息进行预处理加工,计算的词频、权重,初步选取文本特征,根据用户需求描述计算特征相似度,过滤不相关的"噪声"信息,进而保留能够精确描述文本信息的特征。    

12.  基于增量学习的混合推荐算法  
   任磊《计算机应用》,2010年第30卷第5期
   推荐系统是自适应信息系统中的个性化服务模块,可以根据目标用户的信息需求提供个性化的信息服务。针对传统协作过滤算法存在的用户兴趣描述粒度过大问题,以及稀疏评分矩阵造成相似度计算不准确的问题,提出了一种基于增量学习的混合推荐算法WHHR,该算法通过Widrow-Hoff增量学习构建基于内容的用户模型,并结合协作过滤推荐机制实现评分预测。实验验证了WHHR算法在收敛速度和推荐准确性方面较类似推荐算法有较大提高。    

13.  基于编译支持错误跟踪的测试用例自动化生成方法  
   何炎祥  陈勇  吴伟  徐超  吴黎兵《计算机研究与发展》,2012年第49卷第9期
   测试用例的自动生成是实现测试自动化的重要保障,是验证可信软件的基本方法.在分析现有测试用例自动生成方法的基础上,提出了一种基于编译的错误可跟踪的测试用例自动生成方法.该方法以编译器为依托,通过对其语法和语义进行扩展,将测试需求很好地融入到源程序中参与分析,并利用代码生成器在生成目标代码的同时根据相应的分析结果直接生成对应的测试用例.该方法将测试用例和目标代码生成统一到编译器中,避免了独立的测试用例自动生成工具在获得编译器相关分析结果时而导致的接口开销.同时,通过对源程序行号信息的跟踪,使得测试用例在无法通过测试时能够很快定位出错位置,以方便程序开发者修改.最后,通过一个示例程序说明了该方法的具体实现过程,证明了该方法的有效性.    

14.  基于改进VSM的文本信息检索研究  被引次数:1
   张成伟  郑诚《计算机技术与发展》,2009年第19卷第1期
   网络信息的激增和多样化给有效的信息检索带来了种种困难,目前的检索工具忽视了很多文本中所隐含的语义信息,从而导致检索时效率低下,很难满足用户的查询要求.提出了一种基于向量空间模型改进的文本信息检索方法.把本体技术引入到传统的文本信息检索系统中,利用领域本体中概念相似度计算对向量空间模型进行改进,从而实现一个高效的文本检索系统,并简述了系统的模型.实例证明,该方法可以很好地提高文本信息检索的查全率和查准率.    

15.  基于偏好推荐的可信服务选择  被引次数:7
   朱锐  王怀民  冯大为《软件学报》,2011年第22卷第5期
   针对现有服务选择中服务推荐技术的不足,提出一种基于偏好推荐的服务选择(trustworthy services selection based on preference recommendation,简称TSSPR)方法.首先搜索一组偏好相似的推荐用户,并通过皮尔逊相关系数计算用户的评价相似度,然后基于用户的推荐等级、领域相关度和评价相似度等对用户的推荐信息进行过滤,从而使推荐信息更为可信.模拟实验结果表明,通过正确的参数设置,该方法能够有效地解决推荐算法中冷启动、推荐信息不准确等问题.    

16.  基于相似图片聚类的Web文本特征算法  
   方爽  殷俊杰  徐武平《计算机工程》,2014年第12期
   对于图文不符的低质量网页,现有基于文本关键词的图片搜索引擎得到的结果相关性较差。针对该问题,将图片的相似性聚类信息和网页质量因素融入文本分析过程,提出一种基于相似图片聚类的Web文本特征算法。根据网页Page Rank值、关键词HTML标签类别和关键词词性类别的不同,分别赋予其不同的权重并代入计算公式,综合计算得到整个聚类中全部关键词的文本特征值,并通过设置阈值提取高相关文本。对随机选取的15个图片聚类进行实验分析,结果表明,与百度和谷歌目前所用图片搜索算法相比,该算法能够准确地找到反映图片内容的真实文本,提高图片检索的精度。    

17.  一种基于词共现的文本相似度计算  被引次数:1
   曹恬  周丽  张国煊《计算机工程与科学》,2007年第29卷第3期
   在文本检索中,由于用户需求的表达方式不充分,常会得到大量无关信息,给用户检索带来诸多不便。本文提出的基于词共现的文本相似度计算,可以让用户选择去掉或保留和某一文本相似的文本集,提高用户检索效率。    

18.  面向车载监控视频的快速检索设计  
   李雨聪《电视技术》,2013年第37卷第13期
   在车载监控过程中,为提高视频检索的效率,提出了一种快速检索方法.首先,采用一种改进的基于块匹配的方法快速消除视频抖动,完成图像序列预处理;然后根据不同用户需求,通过自动和主动两种方式检索视频.实验结果表明,该方法在不遗漏重要画面的同时,能够快速检索到用户感兴趣的视频片段,为用户减少了大量的视频浏览时间.    

19.  一种基于子图搜索的特征定位方法  
   付焜  吴毅坚  彭鑫  赵文耘《计算机科学》,2017年第44卷第4期
   确定源代码中与给定需求特征相关的程序元素的过程称为特征定位。但现在大部分的特征定位方法仍是以特征相关的描述和代码结构信息为输入,以特征相关的代码元素为输出。这样的结果缺乏代码元素间的关系信息,难以让开发者快速理解相关特征的程序结构。针对这个问题,提出一种基于子图搜索的特征定位方法。该方法能找出与特征相关的代码元素,并以依赖调用图的形式将结果展示出来,让开发者快速了解代码结构。根据该方法实现了相应工具并经过实验验证了方法的有效性。该方法的平均准确率为40.41%,平均召回率为50.28%。    

20.  中文文本的信息自动抽取和相似检索机制  被引次数:1
   林鸿飞  杨志豪  赵晶《小型微型计算机系统》,2007年第28卷第11期
   目前信息抽取成为提供高质量信息服务的重要手段,提出面向中文文本信息的自动抽取和相似检索机制,其基本思想是将用户兴趣表示为语义模板,对关键字进行概念扩充,通过搜索引擎获得初步的候选文本集合,在概念触发机制和部分分析技术基础上,利用语义关系到模板槽的映射机制,填充文本语义模板,形成结构化文本数据库.基于文本数据表述的模糊性,给出用户查询与文本语义模板的相似关系,实现了相似检索,可以更加全面地满足用户的信息需求.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号