首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
为了更合理地挖掘研究团队,提出了一种基于师门关系的研究团队挖掘算法。首先,使用BiLSTM-CRF神经网络模型抽取学位论文致谢部分的师门和同门命名实体;其次,构建师生之间的指导合作关系网络;然后,改进鲁汶算法,提出基于师门关系的鲁汶算法来实现研究团队挖掘。在American College football等数据集上对比了标记传播算法、聚集系数算法与鲁汶算法的性能。此外,在三个不同规模的学位论文数据集上对比基于师门关系的鲁汶算法和原始鲁汶算法的运行效率。实验结果表明,数据规模越大,基于师门关系的鲁汶算法运行效率提升越明显。最后,在国防科技大学学位论文数据集上验证基于师门关系的鲁汶算法的研究团队挖掘性能。实验结果表明,所提算法挖掘的研究团队在团队的合作紧密程度、规模、内部联系和稳定性这四个方面比基于论文合作网络的挖掘方法更为合理。  相似文献   

2.
针对α算法在挖掘短循环结构等方面的不足,提出了一种改进的α算法.该算法先基于事件类型定义任务间序关系;然后依据这些关系逐渐缩小日志,推出序关系矩阵.最后据此矩阵借助形式化步骤生成工作流网.用一个案例解释了算法的执行过程并进行模拟实验,验证了该算法的可行性和有效性.实验结果表明,改进算法比α算法在处理模型结构、重发现模型种类以及挖掘质量上更具优势.  相似文献   

3.
基于关系模型的进化算法收敛性分析与对比   总被引:2,自引:0,他引:2  
研究建立了一种等态等价关系与强/弱态偏序关系模型,用于分析进化算法在收敛性上的等价性与可比性.基于吸收态Markov(马尔可夫)性,满足等态关系的进化算法具有等价的收敛性,从而在收敛性意义上实现了进化算法的等价类划分.在等态关系基础上,建立了弱态和强态的偏序关系,提出了一种对比进化算法收敛性的数学工具,在此基础上设计了...  相似文献   

4.
远监督关系抽取算法能够自动将关系库中的关系与无标注的文本对齐,以进行文本中的关系抽取。目前提出的远监督关系抽取算法中,大多数是基于特征的。然而,此类算法在将实例转换为特征时,经常会出现关键信息不突出、数据集线性不可分等问题,影响关系抽取的效果。该文提出了一种基于模式的远监督关系抽取算法,其中引入了基于模式的向量,并使用了基于核的机器学习算法来克服上述问题。实验结果表明,该文提出的基于模式的远监督关系抽取算法,能够有效地提升远监督关系抽取的准确率。  相似文献   

5.
为了更合理地挖掘研究团队,提出了一种基于师门关系的研究团队挖掘算法。首先,使用BiLSTM-CRF神经网络模型抽取学位论文致谢部分的师门和同门命名实体;其次,构建师生之间的指导合作关系网络;然后,改进鲁汶算法,提出基于师门关系的鲁汶算法来实现研究团队挖掘。在American College football等数据集上对比了标记传播算法、聚集系数算法与鲁汶算法的性能。此外,在三个不同规模的学位论文数据集上对比基于师门关系的鲁汶算法和原始鲁汶算法的运行效率。实验结果表明,数据规模越大,基于师门关系的鲁汶算法运行效率提升越明显。最后,在国防科技大学学位论文数据集上验证基于师门关系的鲁汶算法的研究团队挖掘性能。实验结果表明,所提算法挖掘的研究团队在团队的合作紧密程度、规模、内部联系和稳定性这四个方面比基于论文合作网络的挖掘方法更为合理。  相似文献   

6.
李旭  荣梓景  阮晓曦 《计算机应用》2019,39(10):2852-2858
针对相对不可区分和区分关系约简的问题提出相应的算法。首先,考虑等价关系中相对不可区分关系的约简,提出一种新的辨识矩阵,并在此基础上得到了一种约简算法,通过关系的补关系提出相对区分关系的约简算法。然后,将相对不可区分关系等概念推广到一般关系。对于关系决策系统的相对不可区分关系约简给出了相应的辨识矩阵,并利用关系的补关系得到了相对区分关系约简的辨识矩阵,从而得到了两者的约简算法。最后,在选取的UCI数据集上,对提出的算法进行验证。在等价关系上,基于绝对约简的相对不可区分关系的约简(EQIND)算法与相对不可区分一般关系的约简(BⅡND)算法所得约简相同,基于绝对约简的相对区分关系的约简(EQDIS)算法与相对区分一般关系的约简(BIDIS)算法所得约简相同;同时算法BⅡND、BIDIS可以对不完备决策表进行约简。实验结果验证了所提算法的可行性。  相似文献   

7.
曾雪琳  吴斌 《计算机应用》2016,36(2):316-323
针对传统的协同过滤算法在利用签到记录进行兴趣点(POI)推荐时不能充分利用签到信息所隐含的偏好、位置和社交网络信息而损失准确率的问题,以及传统的单机串行算法在大数据处理能力上的弱势,提出一种基于位置和朋友关系的协同过滤(LFBCF)算法,以用户历史偏好为基础,综合考虑用户社交关系网络进行协同过滤,并以用户的活动范围作为约束实现对用户的兴趣点推荐。为了支持大数据量的实验,将算法在Spark分布式计算平台上进行了并行化实现。研究过程中使用了Gowalla和Brightkite这两个基于位置的社会化网络数据集,分析了数据集中签到数量、签到位置之间距离、社交关系等可能对推荐结果造成影响的因素,以此来支持提出的算法。实验部分通过与传统的协同过滤算法等经典算法在准确率、F-measure上的对比验证了算法在推荐效果上的优越性,并通过并行算法与单机串行算法在不同数据规模上加速比的对比验证了算法并行化的意义以及性能上的优越性。  相似文献   

8.
为弥补传统的语义标注方法在词语或句子成分之间关系描述方面的不足,该文提出了一种基于本体和依存句法的非结构化文本语义关系标注算法。算法以句子为单位,综合POS(Part of Speech)、语义辞典、语言学特征等因素对句子中词汇的语义关系进行识别,利用词语间的依存关系对词语进行语义组合,从而实现词汇语义关系标注。结合语义标注过程中的语义匹配度、语义丰富度等特征,设计了评价算法,用以衡量标注结果的正确性。实验结果表明,该标注算法能获得较高的准确率,在大规模语料下效果尤为显著。  相似文献   

9.
基于网站影响力的网页排序算法   总被引:1,自引:0,他引:1  
张芳  郭常盈 《计算机应用》2012,32(6):1666-1669
传统的排序算法主要是根据网页之间的链接关系进行排序,没有考虑到网站与网页之间互相增强的关系和用户对网页的重要性的评价。为此提出了一种基于更新时间、网页权威性和用户对网页的反映的相关排序算法。该算法以网站为节点计算每个网站权威值,在为网页分配权威值时考虑了网页在网站内的位置和用户对其的反映,并通过网站与网页之间相互影响的关系来相互反馈。实验结果表明,与传统的PageRank、HITS等排序算法相比,该算法在检索性能上有明显提高。  相似文献   

10.
王婷  王祺  黄越圻  殷亦超  高炬 《计算机应用》2017,37(10):2999-3005
针对症状间上下位关系具有较强结构特性的问题,提出一种基于症状构成成分的上下位关系自动抽取方法。首先,通过观察症状实体,发现症状可以切分为原子症状词、修饰词等八种成分,且成分的构成序列满足一定的规则。然后,利用词法分析系统和条件随机场模型对症状进行切分和成分标注。最后,把症状之间的关系抽取看作一个分类问题,选取症状成分的构成特征、词典特征以及通用特征作为分类算法的特征;基于多种分类算法训练模型,将症状间的关系分为上下位关系和非上下位关系。实验结果表明,当选用支持向量机算法,同时选用三类特征时,取得了最好的效果,准确率、召回率和F1值分别达到了82.68%、82.13%和82.40%。在此基础上,使用所提出的关系抽取算法,抽取了20619条上下位关系,构建了具有上下位关系的症状知识库。  相似文献   

11.
并发Java程序动态分析及重演技术研究   总被引:2,自引:0,他引:2  
Java语言在并发程序方面的广泛应用对软件测试提出了新的挑战。众所周知,由于并发程序的不确定性,使得并发程序的设计、开发、调试和测试都非常困难。文章介绍了Safepro/Java中的多线程测试技术,通过对Java源程序进行适当的修改并且保持语义不变,跟踪并发Java程序的运行过程,收集有关数据并对数据进行分析,最终控制并发Java程序的重演。  相似文献   

12.
提出一种基于UML的面向对象软件静态测试的方法,论述了方法的基本框架及针对C 的具体实现,使测试人员能直观地了解程序结构上的错误,并有效地设计测试用例。本静态测试方法是通过分析源程序文件,采用数据库来保存分析结果,并以UML类关系图显示出来。  相似文献   

13.
为了对Java虚拟机(JVM)进行测试,开发人员通常需要手工设计或利用测试生成工具生成复杂的测试程序,从而检测JVM中潜在的缺陷。然而,复杂的测试程序给开发人员定位及修复缺陷带来了极高的成本。测试程序约简技术旨在保障测试程序缺陷检测能力的同时,尽可能的删减测试程序中与缺陷检测无关的代码。现有研究工作基于Delta调试在C程序和XML输入上可以取得较好的约简效果,但是在JVM测试场景中,具有复杂语法和语义依赖关系的Java测试程序约减仍存在粒度较粗、约简效果较差的问题,导致约简后的程序理解成本依然很高。因此,针对具有复杂程序依赖关系的Java测试程序,本文提出一种基于程序约束的细粒度测试程序约简方法JavaPruner。首先在语句块级别设计细粒度的代码度量方法,随后在Delta调试技术上引入语句块之间的依赖约束关系来对测试程序进行约简。以Java字节码测试程序为实验对象,通过从现有的针对JVM测试的测试程序生成工具中筛选出具有复杂依赖关系的50个测试程序作为基准数据集,并在这些数据集上验证JavaPruner的有效性。实验结果表明,JavaPruner可以有效删减Java字节码测试程序中的冗余代码。与现有方法相比,在所有基准数据集上约减能力平均可提升37.7%。同时,JavaPruner可以在保障程序有效性及缺陷检测能力的同时将Java字节码测试程序最大约简至其原有大小的1.09% ,有效降低了测试程序的分析和理解成本。  相似文献   

14.
基于线程的Java程序自动并行转换技术   总被引:2,自引:0,他引:2  
刘英  刘磊  张乃孝 《软件学报》2001,12(3):390-397
Java程序的并行化研究是一个重要课题.提出一种Java程序的自动并行转换技术,并充分利用Java语言本身提供的多线程机制,通过操作冲突性检测等方法将串行化的Java程序自动转化成并行化程序.使得转化后的并行化程序在多处理机操作系统的支持下,能在共享内存的多处理机系统上运行,从而提高了程序的运行效率.  相似文献   

15.
嵌入式软件非干涉测试(NIT)方法[1]是一种不在被测软件中插桩的白盒测试方法,NIT以采集被测软件运行时处理器总线数据得到的数据流为依据进行分析,实现对被测软件的测试与评估[1]。NIT的关键问题在于如何实时分析处理器总线数据流,获得其实际执行的指令序列。为此提出了一种通用的实时数据流分析算法——滑动窗口分析算法,并对该算法的正确性、复杂度和工程实现进行讨论。  相似文献   

16.
Java程序内存泄漏综述*   总被引:1,自引:0,他引:1  
从与C/C++内存泄漏对比的角度分析了Java内存泄漏问题,详细介绍了Java内存泄漏的相关研究和工具,探讨了当前研究和工具中存在的不足并分析了其原因,总结了内存泄漏相关领域研究的发展趋势。  相似文献   

17.
面向对象程序整体结构及其特性的逆向分析和可视化在软件维护、软件重用等过程中起着重要作用。现有的逆向工程工具尽管可以通过对程序代码的静态分析自动获取类模型,但是在自动布图方面仍存在一些明显的问题,特别是难以直观展现类之间的耦合性、聚集效应等程序整体结构的重要特性,从而影响其实际应用。Force-Directed Layout算法能够自然展现复杂结构的耦合关系和聚集现象,因此,将其应用于类图的逆向生成,使其在充分展示程序整体结构的同时,清晰展现类之间的耦合性和聚集效应等结构特征,为软件结构演化分析、缺陷分布分析等提供辅助支持。据此,开发了软件分析与测试工具系列QESat的子工具——基于拉力算法的类图可视化工具QESat/FCD(QualityEasy-Software Analysis and Testing Tools:Force-Directed Class Diagram),通过实例展示了其在大型类图结构特性方面的展现效果。  相似文献   

18.
Concurrency constructs are widely used when developing complex software such as real-time, networking and multithreaded client–server applications. Consequently, testing a program, which includes concurrency constructs is a very elaborate and complex process. In this work, we first identify the different classes of synchronization anomalies that may occur in concurrent Java programs. We then consider testing concurrent Java programs against synchronization anomalies using dynamic data flow analysis techniques. Moreover, we show how the data flow analysis technique can be extended to detect such anomalies.  相似文献   

19.
随机测试(RT)已被用于在基于模型的测试中自动生成满足一定模型覆盖准则的测试用例集合.然而,完全随机的测试用例产生方法可能会导致大量冗余的测试用例.因此,在研究基于UML(Unified Modeling Language)活动图产生测试用例的基础上,提出了一种基于分类树的随机测试用例产生方法(CT-RT),运用分类树分析已运行测试用例的输入域,从而指导产生新的测试用例,并通过实验案例说明了对于UML活动图中的简单路径覆盖.该方法较之完全随机的方法大大减少了冗余测试用例的数量.  相似文献   

20.
聚类分析是应用最为广泛的数学方法之一,但又被认为是数学上不严格的一类方法。主要原因在于聚类过程及其结果没有统计学标准。本文建立了具有随机化统计检验的聚类分析算法,用于对若干个样品进行有显著性标记的聚类分析。该算法由三部分组成:距离测度计算、随机化检验和系统聚类。在该算法中,有14种距离测度、三种系统聚类方方法及指标加权与否可供选择。样品之间的距离定义为:1-随机化检验的P检验值;两类间的距离若满足P检验标准则合并为同一类是统计上显著的、可接受的,否则就是不显著的、不可接受的。算法的特点是:用随机化方法进行差异显著性检验,使得对多种距离测度可进行严格的统计检验,随机化检验不需统计前提和假设,适用于各种统计问问题;用于差异显著性检验的随机化方法需要随机化数值为正整数值,适用范围过窄,用数值同步移位和平移方法可使之适用于实数域。算法用Java语言网络化实现,包含六个类和一个HTFML文件。可通过网络在多种Java兼容的浏览器上实现算法共享。根据水稻田无脊椎动物多样性的调查数据,本文对该算法进行了对比分析,并讨论了选择距离测度的一些原则和进一步研究的途径等问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号