期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

唐爽张灵箫赵俊峰谢冰邹艳珍《计算机科学与探索》2019,13(5):742-752

随着信息技术的不断发展和应用,大量信息系统积累了海量多源异构数据,这些数据中有很大一部分都是结构化数据,具有高维度、低质量、无标注等特点,难以进行特征提取与进一步的知识提炼。主题建模是文本处理和数据挖掘中的一个非常重要的方法,它是一种无监督学习算法,最初用于对无结构的自然语言文本进行建模,可以有效地从文本语义中提取主题信息,以进行特征提取和降维分析,然而主题建模技术尚不能很好应用在关系复杂的多源数据,尤其是结构化数据的处理中。提出了一个基于可扩展主题建模技术的针对结构化与非结构化多源数据分析框架,通过数据导入、数据分析、数据可视化三个步骤对多源数据进行基于主题建模技术的数据分析,并在此基础上实现了一个多源数据分析工具,最后通过两个数据集的实验证明了所提的多源数据分析框架的有效性。相似文献

2.

《软件构件管理规范信息模型》标准介绍 总被引：1，自引：0，他引：1

邹艳珍谢冰李琰梅宏《信息技术与标准化》2006,(6):14-18

介绍了《软件构件管理规范信息模型》标准的制定背景、目标以及国内外相关标准情况,描述了该标准的主要内容,并对模型中的分类法、构件之间的关系等问题进行了讨论. 相似文献

3.

一种基于主题建模的代码功能挖掘工具

华哲邦李萌赵俊峰邹艳珍谢冰李扬《计算机科学》2014,41(9):52-59

代码复用是重要的软件复用方式之一,复用者需要理解软件代码实现的功能方能有效实施软件复用。基于主题建模技术的程序理解方法逐渐受到研究人员的重视,它能够帮助软件开发者和使用者更好地理解软件的功能。目前,基于主题建模技术的程序理解方法一般欠缺对挖掘出的Topic的语义分析,为此提出的基于代码静态分析和LDA技术的代码功能挖掘(Code Function Mining,CFM)方法可作为对这类方法的补充。CFM是一套以代码为研究对象的挖掘、筛选、组织和描述主题(Topic)的方法,该方法能够生成带描述的功能型Topic的层次结构,以供使用者更清晰和方便地浏览、学习软件的功能。功能型Topic的描述能够帮助复用者理解代码功能,其层次结构能够让复用者从不同抽象层次理解代码功能。CFM方法包括4个部分:挖掘Topic、筛选Topic、组织Topic、描述Topic。以CFM方法为基础,设计并实现了一个CFM工具。CFM工具能够分析用户提交的代码,通过Web页面向用户展示带描述的功能型Topic的层次结构。最后,对CFM方法中的几个关键算法进行实验分析,验证了CFM方法的有效性。相似文献

4.

一种基于Internet的JAR包使用信息收集方法

邹艳珍刘昌盛李萌谢冰《计算机科学》2011,38(6):161-164

随着软件复用技术的发展,Internet上出现了大量可以被利用的软件资源,如Web Services, JAR包等。但是,这些软件资源常常缺乏必要的描述信息和使用说明。为此,提出了一种基于Internet的JAR包使用信息收集方法,以帮助用户检索并整理Internet上已经存在的JAR包描述信息和用户使用评论,辅助软件复用的成功进行。基于该方法,设计并实现了北京大学软件资源库JAR包使用信息收集子系统。该系统目前已经为6000余个JAR包资源收集、整理了相关的描述和评论信息。相似文献

5.

基于TPM的运行时软件可信证据收集机制 总被引：1，自引：0，他引：1

古亮郭耀王华邹艳珍谢冰邵维忠《软件学报》2010,21(2):373-387

扩展了已有的软件可信性证据模型,引入了运行时软件可信证据,从而提供了更为全面的软件可信证据模型.为了提供客观、真实、全面的可信证据,提出了一种基于可信计算技术的软件运行时可信证据收集机制.利用可信平台模块(trusted platform module,简称TPM)提供的安全功能,结合“最新加载技术(late launch)”,在操作系统层引入了一个可信证据收集代理.此代理利用TPM,可以客观地收集目标应用程序的运行时可作为软件可信证据的信息,并保障可信证据本身的可信性.该可信证据收集机制具有良好的可扩展性,能够支持面向不同应用的信任评估模型.基于Linux Security Module,在Linux中实现了一个可信证据收集代理的原型.基于该原型,分析了一个分布式计算客户端实例的相关可信属性,并且分析了可信证据收集代理在该应用实例中的性能开销.该应用实例验证了该方案的可行性. 相似文献

6.

基于UML的分布式服务合约库系统建模

下载免费PDF全文

麻志毅邹艳珍《电子学报》2007,35(8):1425-1431

由于服务的分布与协作特性,有必要在服务合约库系统间进行协作.然而,目前的大多数服务合约库系统都遵循自己的服务合约标准和服务合约分类标准.针对这种状况,本文提出了一个用于对分布式服务合约库系统进行建模的元模型.首先,本文描述了一个大多数服务合约库系统所遵循的功能模型,然后基于此从服务合约库系统的结构和互连体系这两方面详细地阐述了这个元模型,并在UML2.0中进行了扩展,形成一个UML外廓.本文进一步地阐述了利用该外廓对青鸟分布式服务合约库系统所建立的模型. 相似文献

7.

一种结构信息增强的代码修改自动转换方法

曹英魁孙泽宇邹艳珍谢冰《软件学报》2021,32(4):1006-1022

在开发过程中,开发人员在进行缺陷修复、版本更新时,常常需要修改多处相似的代码.如何进行自动代码修改已成为软件工程领域的热点研究问题.一种行之有效的方式是：给定一组代码修改示例,通过抽取其中的代码修改模式,辅助相似代码进行自动转换.在现有工作中,基于深度学习的方法取得了一定进展,但在捕获代码间的长程信息依赖关系时,效果不佳.为此,本文提出了一种结构信息增强的代码修改自动转换方法ExpTrans.ExpTrans在解析代码时采用图的形式来表示修改示例,显式地指出了代码中变量之间的依赖关系,同时结合图卷积网络和Transformer架构,增强了模型对代码的结构信息和依赖信息的捕获能力,从而提升了代码修改自动转换的准确性.实验结果表明,对比同类型基于深度学习的方法,ExpTrans在准确率上提升了11.8%~30.8%;对比基于人工规则的方法,ExpTrans在修改实例的数量和准确率上均有显著提升. 相似文献

8.

融合代码与文档的软件功能特征挖掘方法

沈琦钱莹邹艳珍伍仕骏谢冰《软件学报》2021,32(4):1023-1038

在软件复用过程中,简洁清楚的软件功能自然语言描述是帮助复用者快速了解待复用软件项目/代码库的前提和基础.但当前开源软件往往缺乏高质量的软件功能说明文档,使得这一过程变得更加复杂和困难.为此,本文提出了一种融合代码与文档的软件功能特征挖掘方法.该方法以动宾短语的形式描述软件功能特征,通过迭代挖掘软件源代码和以Stack Overflow讨论帖为代表的软件文档,自动提取开源软件的功能特征描述,并构造了层次化的软件功能特征视图.在针对多个开源软件项目的实验中,本文方法可覆盖官方文档中列举的95.38%的软件功能.挖掘结果中语句和功能特征的准确率分别达到了93.78%和92.57%.对比现有工作TaskNav和APITasks,本文方法在平均准确率上分别提升了28.78%和11.56%. 相似文献

9.

面向代码审查的细粒度代码变更溯源方法

王敏潘兴禄邹艳珍谢冰《软件学报》2023,34(10):4705-4723

代码审查是现代软件分布式并行开发过程中的重要机制. 在代码评审时, 帮助代码评审者快速查看某一段源代码的演化过程, 可以让评审者快速理解此段代码变更的原因和必要性, 从而有效提升代码评审的效率与质量. 现有工作虽然提供了一些类似的代码提交历史回溯方法及对应工具, 但缺乏从历史数据中进一步提取辅助代码评审相关辅助信息的能力. 为此, 提出一个面向代码评审的细粒度代码变更溯源方法C2Tracker. 给定一段方法(函数)级别的细粒度代码变更, C2Tracker能够自动追溯到历史开发过程中修改该段代码相关的代码提交, 并在此基础上进一步挖掘其中与该段代码频繁共现修改的代码元素以及相关的变更片段, 辅助代码评审者对当前代码变更的理解与决策. 在10个著名开源项目的数据集下进行实验验证. 实验结果表明, C2Tracker在追溯历史提交的准确率上达到97%, 在挖掘频繁共现代码元素任务上的准确率达到95%, 在追溯相关代码变更片段任务上的准确率达到97%; 相比现有评审方式, C2Tracker在具体案例的代码评审效率和质量上均有较大提升, 在绝大多数的代码评审案例中被评审者认为能提供“明显帮助”或“很大帮助”. 相似文献

10.

一种支持软件资源可信评估的框架 总被引：2，自引：0，他引：2

蔡斯博邹艳珍邵凌霜谢冰邵维忠《软件学报》2010,21(2):359-372

提出了一种支持软件资源可信评估的框架,并分析了该框架涉及到的技术,如证据收集、证据信任管理和可信评估等.阐述了该框架在北京大学软件资源库中的设计决策和实现方案,并给出一个详尽的实例分析. 相似文献