首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 194 毫秒
1.
卢冬冬  吴洁  刘鹏  盛永祥 《计算机科学》2020,47(12):100-105
文中以开源软件AngularJS项目为例,探究关键开发者类型和协作网络鲁棒性。通过抽取代码修订关系构建开发者协作网络,分析网络的结构和功能。综合开发者的结构与功能属性进行类型划分,探究不同类型开发者流失后网络的结构和功能鲁棒性,以此识别出关键开发者类型。最后模拟新开发者的加入机制,探讨网络鲁棒性的提升策略。研究发现:开发者的结构和功能属性的不对称性导致了开发者协作网络的结构和功能鲁棒性的不一致性;与传统方法相比,对开发者进行类型划分能够更有效地识别关键开发者类型;在社团内部较活跃、与其他社团之间存在密切联系并且拥有大量贡献度的中央核心型开发者对网络鲁棒性影响最大;拥有较大初始度且选择倾向性连接的新开发者加入机制能够有效提高网络鲁棒性。  相似文献   

2.
社交化编码是当前软件开发生产的一个重要方式,其开发模式的灵活性与开放性吸引了大量的开发者.开发者通过参与开源项目能够提升自己的开发能力并在社区中形成自己的影响力.许多开源社区如GitHub上有大量的开源项目.开发者将花费大量的时间与精力去寻找自己感兴趣的项目.开源项目推荐引起了研究者的兴趣,然而,目前的方法中仅仅基于开发者过去参加过的项目的相似性进行项目推荐,没有对开发者的兴趣迁移进行考虑.针对这一问题,本文提出了一种基于项目主题迁移频繁模式挖掘的推荐算法.该方法结合了概率主题模型与顺序频繁模式挖掘,并考虑项目社交关联和流行度,从而为开发者提供个性化开源项目推荐.本文所提方法的召回率比传统的方法高出了10.9%,推荐效果显著提升.  相似文献   

3.
谢新强  杨晓春  王斌  张霞  纪勇  黄治纲 《软件学报》2018,29(8):2306-2321
软件开发者能力评价和协作关系推荐是大数据环境下软件智能化开发领域的一个研究热点.通过分析互联网开发者社区和企业内部开发环境,设计出基于模糊综合评价的开发者能力模型;随后,通过挖掘开发者与任务的动态交互行为、静态匹配度以及开发者能力三个不同维度的特征并结合矩阵分解技术,提出一种能力与行为感知的多特征融合协同过滤开发者推荐方法,最终解决开发者推荐面临的评价矩阵稀疏性和冷启动问题,提升个性化精准推荐效率.从系统层面给出适合大数据环境的多特征融合开发者推荐原型系统实践及对现有开源技术框架的优化改进,实验过程分别基于互联网问答社区StackOverflow和企业内部GitLab环境进行了实验分析.最后,对未来研究可能的问题及思路进行了展望.  相似文献   

4.
根据开发者的历史开发信息,推荐潜在合作对象或能够胜任的任务,对于减少开发延时,提高团队开发效率有极大的促进作用.大量已有工作主要研究单个开源项目开发者社区,通过确定开发者的个人技能实施推荐.然而,以整个开源社区为视角,研究使用开发者实践技能做推荐,实现开发者跨项目与组织边界合作的工作相对甚少.为丰富这一工作,文中结合开发者的实践技能相似性与共同开发者数,为Sourceforge.net社区未曾合作的开发者提供一种同行推荐的方法.研究结果表明文中的方法能够有效地实现开发者同行推荐,相比只考虑共同开发者数时成功推荐的开发者数增加了31.1%,且推荐精度提高0.4倍,缓解了社区合作的稀疏性.最后,应用文中提出的方法开发了一个Roster推荐系统,为社区开发者的交流建立了一种新的辅助途径.  相似文献   

5.
随着开源概念的逐步深入,开源软件成为软件发展的潮流.同时,开源软件的使用受各类开源许可证约束.开源参与者在开发过程中该如何为自己的开源软件选择合适的许可证,确保高效合理地使用社区群体智慧劳动成果,仍是一个亟需解决的问题.为此,首先分析和解读了开放源代码促进会认证的常用开源许可证,通过对许可证条款内容和结构的研究,得到开源许可证框架及许可证兼容性推导模型,并将该模型应用于对我国自主研发的木兰宽松许可证的分析和解读.最后,基于上述工作研发了开源许可证选择工具,为开源开发者对许可证的理解和合规使用提供了参考和决策支持.  相似文献   

6.
孙小兵  周澄  杨辉  李斌 《软件学报》2018,29(8):2294-2305
软件开发与维护过程中常会出现一些安全性缺陷,这些安全性缺陷会给软件和用户带来很大的风险.安全性缺陷在修复过程中,其修复级别和质量要求往往高于一般性的缺陷,因此,推荐出富有安全性经验的开发者及时有效地修复这些安全性缺陷非常重要.现有的开发者推荐技术在推荐开发者时仅仅考虑了开发者的历史开发内容,很少考虑到开发人员的安全性缺陷修复经验和修复质量等因素,所以这些技术不适用于安全性缺陷的开发者推荐.本文针对安全性缺陷的修复提出了一种有效的软件开发者推荐方法SecDR.SecDR在推荐开发者时不仅考虑了开发者的历史开发内容(与安全性相关),还分析了开发者的修复质量和历史修复缺陷的复杂度等因素.此外,SecDR还实现了开发者的多经验级别推荐:推荐初级开发者修复简单的安全性缺陷,高级开发者修复复杂的安全性缺陷.本文在三个开源项目(Mozilla,Libgdx,ElasticSearch)上分别对SecDR推荐开发者进行有效性验证.通过对比实验证明,SecDR针对安全性缺陷推荐开发者相比于其他方法(如:DR_PSF)的推荐精度平均高出19%~42%.另外,实验对比了SecDR与实际开发人员的分配情况,结果显示SecDR可以更好地规避不合理的软件开发者的推荐.  相似文献   

7.
蒋竞  吕江枫  张莉 《软件学报》2020,31(4):1143-1161
软件问答社区是软件开发者通过问答方式进行技术交流的网络平台.近年来,软件问答社区积累了大量用户讨论的技术问答内容.一些研究者对Stack Overflow等英文问答社区进行主题分析研究,但是缺少对于中文软件问答社区的分析.通过对中文软件回答社区开展主题分析研究,不仅可以指导开发者更好地了解技术动向,而且可以帮助管理者改进社区、吸引更多用户参与."开源中国"是中国最大的技术社区之一.对"开源中国"开展了开发者问题主题分析研究.收集"开源中国"的92 383个开发者问题,采用隐狄利克雷分配模型的主题分析方法,分析开发者问题的主题分布、热度趋势、回答情况和关键技术热度等.发现:(1)开发者讨论的技术主题分为前端开发、后端开发、数据库、操作系统、通用技术和其他6个类别.其中,前端开发讨论占比最大.(2)后端开发下的主题中用户的关注重点从传统的项目部署、服务器配置转移到较新的分布式系统等主题.(3)数据展示主题的零回答问题比例最高,数据类型主题下的零回答问题比例最低.(4)在技术学习主题下,用户对于Java的讨论明显多于对Python的讨论.  相似文献   

8.
何鹏  李兵  杨习辉  熊伟 《计算机科学》2015,42(2):161-166
着重从开发者角度出发,先对SourceForge.net开源社区项目与开发者数量增长情况进行统计分析,以见证社区的快速发展;随后以两个月为时间段分析新增开发者、合作的数目,并将开发者之间新建的合作细分为4种情况,探析4种合作方式情况下的差异,进而判断社区开发者优先选择合作方式的顺序;最后针对新开发者与社区已有开发者之间的合作,分析了新开发者的合作偏好与已有开发者的度数中心性、介数中心性和接近中心性,以及他们的开发项目数与之前项目中角色的关系,发现新成员优先选择与介数中心性或度数中心性大的已有开发者合作,且这些开发者整体上都具有多次开发经验并在开发过程中担任过特定角色。研究结果有利于优化群体软件开发过程,为提高群体软件开发效率与质量水平奠定了基础。  相似文献   

9.
吴哲夫  朱天潼  宣琦  余跃 《软件学报》2018,29(8):2272-2282
开源软件中如何真实评估所有开发者的贡献度并有效区分核心开发者和外围开发者是一个重要的研究问题.通过设计开发文件的贡献度分配算法,以9个Apache项目为基础分析了开发者对项目的贡献度,并以此有效地区分核心开发者和外围开发者.实验结果通过Apache官方主页公布的开发者地位名单进行考证,同时在真实名单的相似度上与传统评估方案进行了比较,验证了算法的实用性和有效性.最后,通过支持向量机建立分类模型,结合不同影响开发者地位的关键因素,提升了开发者分类的精确度.  相似文献   

10.
李其锋  李兵 《计算机科学》2015,42(12):43-46
开源软件的开发主要依靠开发人员的自我管理和志愿贡献。在软件开发过程中,开发人员的组成、分工、能力等会发生经常性的改变,这些改变都会通过交互行为的变化反映出来。已有研究成果表明开源软件存在核心团队,他们主导项目的开发与实施,但对开发团队随时间而发生的结构变化的研究较少。通过观测软件项目生命周期中开发者总体的变化情况,研究了开发者网络与软件的协同演化机理,以GNU/Linux公共数据集为例,讨论了开源软件开发者数量、自愿度、开发者经验与项目的协同演化现象,并给出了演化的合理解释。  相似文献   

11.
基于社团检测的复杂网络中心性方法   总被引:1,自引:0,他引:1  
论证了社团检测函数模块密度的优化进程能转化为核矩阵的特征谱分.基于核矩阵最大特征值对应的特征向量,提出了一种新的中心性方法,称为模块密度中心性方法.与以往中心性度量方法不同,这种方法以模块密度检测复杂网络中的社团结构为基础,度量了第一个节点到它分配社团上的贡献,对社团的贡献越大,该节点的中心性值越高,反之亦然.通过合成网络和标准数据集网络,验证了该方法,并同其他中心性方法进行了比较,实验表明提出的模块密度中心性方法对网络中关键节点有更好的解和稳定性.进一步在计算机产生的两个大的随机网络和来自现实世界的两个大的复杂网络中,研究了模块密度中心性方法的统计分布.结果表明了提出的中心性方法能够刻画复杂网络的拓扑结构属性.  相似文献   

12.
大数据为企业进行精准营销提供了重要支撑,精准营销能提升营销效果,提高客户满意度,精准营销的前提是客户识别与选择。通过分析网络个体与群体特征,社交网络分析能够定位核心价值客户。首先对社交网络的中心性进行分析,探讨社交网络节点地位与营销效果的关系,运用社群识别方法,对社交网络进行分群,提出并用MapReduce实现了针对大规模社交网络的社群划分RMCL方法。在此基础上,构建了客户影响度与客户影响因子等指标,并结合中心度指标,定位社群的核心节点,并采用分类回归树方法,研究了社交网络结构与客户消费响应关系,并确定了变量重要性,为企业采取客户差异化营销组合策略提供指导。  相似文献   

13.
An open source software (OSS) ecosystem refers to an OSS development community composed of many software projects and developers contributing to these projects. The projects and developers co-evolve in an ecosystem. To keep healthy evolution of such OSS ecosystems, there is a need of attracting and retaining developers, particularly project leaders and core developers who have major impact on the project and the whole team. Therefore, it is important to figure out the factors that influence developers’ chance to evolve into project leaders and core developers. To identify such factors, we conducted a case study on the GNOME ecosystem. First, we collected indicators reflecting developers’ subjective willingness to contribute to the project and the project environment that they stay in. Second, we calculated such indicators based on the GNOME dataset. Then, we fitted logistic regression models by taking as independent variables the resulting indicators after eliminating the most collinear ones, and taking as a dependent variable the future developer role (the core developer or project leader). The results showed that part of such indicators (e.g., the total number of projects that a developer joined) of subjective willingness and project environment significantly influenced the developers’ chance to evolve into core developers and project leaders. With different validation methods, our obtained model performs well on predicting developmental core developers, resulting in stable prediction performance (0.770, F-value).  相似文献   

14.
一种网络社团划分的评价及改进方法   总被引:1,自引:0,他引:1  
主要从节点在所属群体内的相对重要程度出发, 尝试性地给出一种网络社团结构的新定义, 并在此基础上构建了一种网络社团划分的评价及改进方法。该方法既可以与现有的社团划分算法进行组合, 形成新的网络社团划分算法, 也可以独立使用, 对网络社团的划分结果进行评价与改进。最后, 通过MCL、GN、Factions等方法及算例对提出的算法进行了验证与分析。  相似文献   

15.
在当今互联网时代,电子邮件的快速、低耗等特性,使其成为人们生活和工作中的必需工具。为了智能化地提取和分析邮件网络中的海量数据,以从海量邮件数据中挖掘潜在的有价值的信息,将社会网络分析方法应用于邮件网络分析,提出了基于CN-M( Core Node-Modularity)的邮件网络核心社团挖掘算法。首先用JavaMail对数据进行解析,将解析后的数据保存在数据库中,使用这些数据来构建邮件网络图,根据节点的连接中心度、紧密中心度和中间中心度计算加权中心度,由加权中心度最大的节点开始,根据模块度指标进行核心社团的挖掘。实验结果表明该算法可以很好地挖掘邮件网络中潜在的核心社团。  相似文献   

16.
在对基于核磁共振成像技术重构得到的人脑结构网络的研究中,核心节点的识别是对全脑网络特性展开研究的基础,具有重要意义。给出了一种基于K-shell和介中心性的核心节点评价方法,首先使用以节点局部重要性为标准的度中心性、邻近中心性和介中心性三个中心性评价方法分别对人脑结构网络中的节点重要性展开评估和分析;接着利用以节点全局地位为标准的K-shell分解法对人脑结构网络的核心节点展开分析。实验结果显示,由于同时兼顾了脑网络节点的整体特性和局部特性,该方法能够更全面和准确地识别核心脑区节点。  相似文献   

17.
There have often been attempts to examine technological structure and linkage as a network. Network analysis has been mainly employed with various centrality measures to identify core technologies in a technology network. None of the existing centrality measures, however, can successfully capture indirect relationships in a network. To address this limitation, this study proposes a novel approach based on the analytic network process (ANP) to identification of core technologies in a technology network. Since the ANP is capable of measuring the relative importance that captures all the indirect interactions in a network, the derived “limit centrality” indicates the importance of a technology in terms of impacts on other technologies, taking all the direct and indirect influences into account. The proposed approach is expected to allow technology planners to understand current technological trends and advances by identifying core technologies based on limit centralities. Using patent citation data as proxy for interactions between technologies, a case study on telecommunication technologies is presented to illustrate the proposed approach.  相似文献   

18.
随着网络结构的不断扩大和日益复杂,重叠社区发现技术对挖掘复杂网络深层潜在结构具有重要意义.本文提出一种基于时间加权的重叠社区检测算法.该方法考虑了用户兴趣的时间因素,构建带有时间加权链接的用户-用户图.接着,基于网络节点的影响力计算用户全局相似度,在此基础上通过计算节点的中心度作为度量节点对社区结构影响力的重要性指标,...  相似文献   

19.
基于K-means聚类算法的复杂网络社团发现新方法   总被引:4,自引:3,他引:1  
提出了一种基于K-means聚类算法的复杂网络社团结构划分方法。算法基于Fortunato等人提出的边的信息中心度,定义了节点的关联度,并通过节点关联度矩阵来进行聚类中心的选择和节点聚类,从而将复杂网络划分成k个社团,然后通过模块度来确定网络理想的社团结构。该算法有效地避免了K-means聚类算法对初始化选值敏感性的问题。通过Zachary Karate Club和College Football Network两个经典模型验证了该算法的可行性。  相似文献   

20.
基于搜索密度峰值的聚类思想,设计了一种网络节点的中心性度量模型,并提出了一种重叠社区发现算法.首先,定义了网络节点的内聚度和分离度,分别用于描述网络社区内部连接稠密和外部连接稀疏的结构特征,在此基础上计算节点的中心性度量表达节点对社区结构的影响力.接着,利用3δ法则选择中心度异常大的节点作为社区中心.以隶属度表达社区间的重叠特性,并给出了非中心节点的隶属度迭代计算方法,将各节点分配到其可能隶属的网络社区,以实现重叠社区划分.最后,利用人工网络和真实网络对提出的重叠社区发现算法进行验证,实验结果表明:该算法在社区发现质量和计算效率方面都优于许多已有重叠社区发现算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号