首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
基于概念邮件系统的犯罪数据挖掘新方法   总被引:2,自引:0,他引:2  
将数据挖掘技术应用于反犯罪和反恐怖是目前各国安全部门的研究热点。目前国内在分析犯罪和恐怖团伙之间联系行为等方面的研究工作有限。本文主要做了下列探索:(1)建立了一个可用的基于邮件用户个性特征和情报属性的概念仿真邮件系统CEM(Conceptual based EMail system),模拟潜在的犯罪和恐怖组织利用电子邮件进行通信的规律;(2)利用符合个性特征和情报属性上的正态分布,模拟真实的邮件进行数据的收发;(3)使用社会网络分析和时间序列分析方法对邮件通信量进行深层次分析,挖掘有意义的邮件通信模式,进而发现异常通信行为;(4)通过实验证明CEM系统具有很好的鲁棒性和伸缩性,可以准确地模拟大量用户的邮件收发,解决了目前仿真数据不足的缺点,并用于发现不同性格特征群体收发邮件的规律。  相似文献   

2.
数据挖掘应用于犯罪集团或恐怖组织社会网络结构分析已经成为公安信息系统领域的研究热点,国内外在分析犯罪和恐怖组织之间的内在规律方面的研究工作亟待深入.与一般的数据挖掘技术相比,图能够表达更加丰富的语义,基于图数据挖掘技术应用于犯罪规律研究是一种新兴的研究方法.为了挖掘犯罪规律和频繁出现的核心成员,首先提出了基于图数据挖掘的相关理论,然后提出了基于相同犯罪特征频繁子图结构的挖掘犯罪规律算法GDMCR(Graph Data Mining Crime Rule),最后利用GDMCR算法得到的频繁子图关联知识分析犯罪规律及网络核心成员.实验证明了文中提出的基于图数据挖掘犯罪规律分析系统的有效性和实用性,并验证了GDMCR算法的有效性.  相似文献   

3.
社会网络分析是数据挖掘的新热点。文中综述了社会网络分析研究动态,介绍了作者近期在社会网络挖掘方面的三项探索,包括:(a)虚拟社团的结构挖掘,讨论了初始社团生成、权重计算,社团树生成和社团结构挖掘算法。(b) 基于六度分割和最短路径社团核心成员挖掘,讨论了计算节点间的最短路径,根据六度分割定理的剪枝,基于SPLINE算法和中心度挖掘犯罪子团伙中的核心的技术。(c)基于用户属性的通信行为挖掘,讨论了用户个性和通信行为关系的量化描述,采用911事件解密数据来建立社会网络,用于模拟恐怖分子间邮件的收发。  相似文献   

4.
在当今互联网时代,电子邮件的快速、低耗等特性,使其成为人们生活和工作中的必需工具。为了智能化地提取和分析邮件网络中的海量数据,以从海量邮件数据中挖掘潜在的有价值的信息,将社会网络分析方法应用于邮件网络分析,提出了基于CN-M( Core Node-Modularity)的邮件网络核心社团挖掘算法。首先用JavaMail对数据进行解析,将解析后的数据保存在数据库中,使用这些数据来构建邮件网络图,根据节点的连接中心度、紧密中心度和中间中心度计算加权中心度,由加权中心度最大的节点开始,根据模块度指标进行核心社团的挖掘。实验结果表明该算法可以很好地挖掘邮件网络中潜在的核心社团。  相似文献   

5.
何晶  李本先 《自动化学报》2019,45(11):2137-2147
恐怖组织网络是一种特殊的复杂网络,其时空演化规律反映出恐怖组织活动的特征.为更准确地理解恐怖组织网络的动态演化规律,提出一种基于多局域的恐怖组织网络择优增长演化模型,并对此模型进行了仿真与模拟.该模型能准确地描述在局部信息条件下,新节点的择优和网络的增长过程及其规律;并且利用网络信息中心度来衡量恐怖组织网络节点的信念水平,动态地刻画了恐怖组织网络的增长过程.实验结果表明:恐怖组织网络的局域度分布仍服从幂律分布,网络信息中心度具有集中与分散性的特征;最后,对多个恐怖组织网络按该模型进行仿真演化,验证了该模型的准确性与科学性.  相似文献   

6.
邮件挖掘技术在社会网络分析中的研究与应用   总被引:1,自引:0,他引:1  
邮件挖掘是数据挖掘领域中一项新兴的技术,它的出现源于电子邮件在人们生活中的广泛使用以及数据挖掘技术的日益成熟.介绍分析了这项技术及其崭新的一个应用--社会网络分析SNA,并根据当前国际研究现状与发展趋势,提出了社会关系网络的构建方法以及社团挖掘改进算法和相关优化策略.描述了社会网络分析系统框架结构的设计与搭建.  相似文献   

7.
挖掘邮件网络通信中的用户行为模式并分析其演变过程对于检测数据泄漏、内部威胁等工作都有着重要指导意义.已有的邮件网络用户行为模式挖掘方法可大致分为两大类:基于邮件内容和基于网络结构.基于邮件内容的挖掘方法存在侵犯用户隐私或者因加密导致无法获得邮件内容等诸多局限性;基于网络结构的挖掘方法常把邮件网络视为是一个完整的网络,而忽略了组织外部邮箱间通信信息存在的缺失,使得提取某些特征时出现偏差,从而会影响到结论的准确性.文中将邮件网络分为两部分:域内通信网络和有连接缺失的域外通信网络,分析了域内通信和域外通信信息完整性的差异,分别提取了其各自的结构特征和职能特征.通过引入模元的概念,将常见的二元对应关系(特征-模式)转化为三元对应关系(特征-模元-模式),并从模元的角度来对用户模式进行统一描述.文中的工作有助于对用户行为模式的理解与对比,同时又具有降维的作用.在Enron邮件数据集上的实验结果表明文中方法将用户行为模式更加简洁地表示出来,并且能够通过分析用户行为模式的变化来直观地定位事件的发生.  相似文献   

8.
钟钰 《福建电脑》2012,28(10):61-63
本文将社会网络分析方法应用于通信话单的分析并与犯罪侦查相结合,它从社会学的角度,对由用户和用户间的通信关系所构成的交往网络进行了分析,从而为犯罪侦查提供服务。社会网络分析方法是一种量化的社会学分析方法。它将社会行动者映射为图的节点,社会行动者之间的关系映射为图中的边,然后利用图论的相关知识来解决社会网络的问题。  相似文献   

9.
唐伦  陈前斌  曾孝平  李云 《计算机工程》2008,34(22):271-273
针对泛在网络面临局部自治性、异构性、复杂性、混沌性等问题,提出一种基于社会网络分析的泛在网络体系架构及网络仿真平台,并进行原型系统实现。采用社会网络分析中的社会网络的管理、组织和协作机制,利用Multi-Agent技术,从泛在网络体系架构、泛在网络软件平台、虚拟组织、管理Agent、工作者Agent等方面进行设计,同时对Agent通信语言进行基于XML的扩展。实验结果证明,该平台可用于仿真复杂的泛在网络服务与应用。  相似文献   

10.
人工蜂群算法是一种新型的搜索算法,其机理是通过模拟蜂群采蜜过程中体现出的智能行为来实现对问题的求解.在现有的蜂群算法中,蜂群间的信息交流仅使用单一的行为通信(跳舞),蜂群间的协作存在明显不足,影响了蜂群算法的求解性能.根据真实蜜蜂多模式传递信息的客观事实,通过引入基于引导素的化学通信方式,提出一种新的更忠实反映蜂群信息传递的蜂群算法,并应用于多维背包问题(MKP)的求解.新算法将行为通信和化学通信相融合,利用引导素的更新和扩散机制使蜂群能够更好地进行协作.MKP的仿真实验结果表明新算法优于传统的ABC算法.与其他一些元启发式搜索算法的比较同样显示了新算法的有效性.  相似文献   

11.
谢柏林  黎琦  魏娜  邝建 《计算机工程》2023,49(1):279-286+294
社交网络已成为人们获取和发布信息的一个重要平台,也是黑客发起网络诈骗的主要场地。大多数黑客在发起网络诈骗之前,首先会判别目标用户的主要人格特点,然后根据主要人格特点制定与其接触的策略。因此,面向社交网络用户的人格特质识别方法的研究对提高用户识别社交网络诈骗能力具有重要意义。提出基于用户的人格特质识别方法。通过构建面向社交网络的人格特质词典提取用户发表或转发文本信息中能反映用户主要人格特质类型的观测值,采用5个具有不同参数值的隐半马尔可夫模型刻画用户在社交网络上发表或转发文本信息的行为过程。在人格特质识别阶段,通过计算每个用户在发表或转发文本信息过程中产生的观测序列相对于模型的平均对数似然概率,以识别用户所属的人格特质类型。在采集的新浪微博数据集上进行实验,结果表明,当假正率为10%时,该方法的总真正率为93.18%,能准确识别用户的人格特质类型。  相似文献   

12.
针对社交网络中提高用户的高黏性问题,提出了一种基于用户忠诚度的用户发现的算法。该算法利用双重RFM模型对用户忠诚度进行计算,挖掘出忠诚度不同分类的用户。首先,通过双重RFM模型动态计算出用户在某一时间段的消费价值与行为价值,得到用户某一时间段的忠诚度;其次,根据用户的忠诚度,确定标度曲线,利用相似度计算找到典型的忠诚用户与不忠诚用户;最后,采用基于模块度的社区发现与独立级联传播模型,发现潜在的忠诚用户与不忠诚用户。在某社交网络的微博数据集上,实现了社会性网络服务(SNS)下用户忠诚度的量化表示,获得了基于用户忠诚度的用户发现结果。实验结果表明,所提算法能够有效挖掘出基于忠诚度的用户分类,可以为社交网站针对用户的个性化推荐及营销等,提供理论支持和实用方法。  相似文献   

13.
尹美娟  陈庶民  刘晓楠  路林 《计算机科学》2011,38(12):182-186,199
邮箱用户身份信息挖掘是数据挖掘研究的一个热点。当前相关研究大多仅从邮件头中抽取邮箱用户的别名,遗漏了邮件正文中潜藏的更能代表通信双方身份的别名信息。针对纯文本邮件正文中邮箱用户别名信息抽取问题,提出了基于统计和规则过滤的称呼块和签名块定位算法,该算法能高效准确地从邮件正文中提取出蕴涵邮箱用户别名的称呼块和签名块文本片段;进一步提出了基于别名边界词汇模板修正的别名抽取方法,从而提高了仅基于命名实体识别或词性标注工具识别别名的准确率。实验结果表明,提出的方法可以有效地抽取出邮件正文中邮箱用户的别名。  相似文献   

14.
提出一种基于行为分析的用户兴趣建模方法,计算用户短期兴趣和长期兴趣,以满足流媒体服务中的个性化需求,提高服务的效率。该方法在综合分析用户历史行为的基础上,考虑了不同行为与用户兴趣偏向之间的关系。实验结果表明,该方法能够较为准确地评估用户兴趣偏好。  相似文献   

15.
为了提升社交网络个性化推荐能力,结合用户行为分布进行个性化推荐设计,文中提出基于用户行为特征挖掘的个性化推荐算法,构建社交网络的用户行为信息特征挖掘模型,采用显著数据分块检测方法对社交网络用户特征的行为信息进行融合处理,提取反映用户偏好的语义信息特征量。从情感、关键词和结构等方面根据用户行为特征组,结合模糊信息感知方法进行社交网络个性化推荐过程中的信息融合处理,在关联规则约束控制下,构建社交网络用户偏好特征的混合推荐模型,实现用户偏好特征挖掘,根据语义分布和用户的行为偏好实现社交网络的个性化信息推荐。仿真结果表明,采用所提方法进行社交网络个性化推荐的特征分辨能力较好,对用户行为特征的准确识别能力较强,提高了社交网络推荐输出的准确性。  相似文献   

16.
采用大数据处理技术和并行计算方法进行融合社交网络的用户行为特征的挖掘,实现社交网络智能推荐,提出一种基于用户行为挖掘的融合社交网络推荐模型。采用关联规则分布模型进行融合社交网络的用户行为特征检测,提取融合社交网络的用户行为的本体信息和关联规则项,构建社交网络的联合推荐的模糊决策模型,计算融合社交网络用户行为的联合信息熵特征值,采用模糊C均值聚类方法对提取的特征量进行分类识别,根据分类识别结果实现用户行为挖掘和融合社交网络的自适应推荐。仿真结果表明,采用该方法进行融合社交网络的用户行为特征挖掘的查准率较高,推荐的置信度水平较高。  相似文献   

17.
吴不晓  肖菁 《计算机应用》2015,35(6):1663-1667
目前多数社交网络主要根据已有好友关系推荐潜在好友,用户的兴趣爱好不作为主要考虑因素;此外,如何从大量数据中精确地提取用户的兴趣爱好是一项十分艰巨的任务。为此,提出一种在大量标注行为数据中精确挖掘出用户的兴趣爱好,并据此推荐具有相同兴趣爱好的潜在好友的算法--基于标注的好友推荐(FRBT)算法。首先使用词频-逆向文件频率(TF-IDF)对标签进行聚类,将语义相似的标签聚成话题;然后在话题的基础上提出一种新的相似度公式来计算用户相似度;再融合基于话题与基于物品的用户相似度,将相似度较高的用户作为潜在好友进行推荐。在Delicious数据集上以准确率和召回率为指标与item、tag和tri-graph三种算法进行比较,实验验证了该算法能够更准确地为用户推荐兴趣相似的好友。  相似文献   

18.
Transfer learning has attracted a large amount of interest and research in last decades, and some effort has been made to build more precise recommendation systems. Most previous transfer recommendation systems assume that the target domain shares the same/similar rating patterns with the auxiliary source domain, which is used to improve the recommendation performance. However, almost all existing transfer learning work does not consider the characteristics of sequential data. In this paper, we study the new cross-domain recommendation scenario by mining novelty-seeking trait. Recent studies in psychology suggest that novelty-seeking trait is highly related to consumer behavior, which has a profound business impact on online recommendation. Previous work performed on only one single target domain may not fully characterize users' novelty-seeking trait well due to the data scarcity and sparsity, leading to the poor recommendation performance. Along this line, we propose a new cross-domain novelty-seeking trait mining model (CDNST for short) to improve the sequential recommendation performance by transferring the knowledge from auxiliary source domain. We conduct systematic experiments on three domain datasets crawled from Douban to demonstrate the effectiveness of our proposed model. Moreover, we analyze the directed influence of the temporal property at the source and target domains in detail.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号