共查询到20条相似文献,搜索用时 15 毫秒
1.
提出一种基于马尔可夫链的主题和时间敏感的合作关系网络实体排序算法TTS-Rank,将节点排序过程解释为随机投票过程.算法首先将合作关系网络按照合作主题进行投影,然后在马尔可夫链随机游走模型中扩展了合作时间敏感的状态转移函数,最后根据迭代计算出的各节点得票数对实体进行排序.基于互联网开源社区合作关系网络数据的实验表明,TTS -Rank算法较传统算法更为精确,能有效支持面向不同技术主题、不同时间区间的实体排序. 相似文献
2.
3.
基于概念获取的多文档主题划分研究 总被引:1,自引:0,他引:1
对多个相关文档进行主题划分对于信息检索、自动摘要等研究领域都有重要的应用价值.当前流行的文本主题划分技术中,多采用词频向量进行文本表示,而研究表明将特征向量映射到概念级,将改善多文档主题划分的效果.本文提出了一种应用知网(HowNet)来获取多文本的概念作为特征向量,再应用聚类的方法对文档集中的相似段落进行归类,得到主题划分的结果,解决了多文档的结构分析问题.实验结果表明该方法对多个相关文档的主题划分取得了良好的效果. 相似文献
4.
BBS中主题发现原型系统的设计与实现 总被引:3,自引:1,他引:3
BBS论坛已经成为人们获取信息、发表言论的重要场所,它由论坛注册用户所发表的大量主题组成。论文针对传统的BBS论坛中有影响力主题计算方法的不足,通过计算词语在回帖传播链上的影响力,提出了一种根据对有影响力词语聚类的方法发现BBS论坛中具有影响力的主题。它能够使用户和论坛管理人员及时、准确和方便地提取重要的主题信息。 相似文献
5.
6.
7.
基于层次聚类的时间序列在线划分算法 总被引:2,自引:0,他引:2
如何在线划分数据序列以满足持续动态增长的海量数据流需求正成为序列挖掘领域中的重要内容之一.本文提出一种新的基于层次聚类的在线序列分割算法(OSHC).利用数据序列的有序性特征,构造一种存储划分特征的链表结构SF-List.该算法通过一次扫描数据库实现数据序列的在线划分,时间复杂度为O(n).利用SF-List 中保存的划分特征信息,历史信息的快速查询成为可能.实验结果表明OSHC算法具有良好的划分性能和扩展性能. 相似文献
8.
9.
阐述了一种主题发现系统,它能发现数据流中的隐含知识,并将其表述为含有主题/副主题的层次树,每个主题包含与其相关的文档集和文档摘要,以便于用户从层次树中浏览和选择所需主题.并提出了一种增量层次聚类算法,该算法结合了划分聚类和凝聚聚类的主要优点.实验结果表明,无论是作为主题检测系统还是分类和概括工具,该算法都是高效的. 相似文献
10.
11.
12.
13.
《计算机工程与应用》2017,(17)
网络社交媒体用户个人隐私信息的保护具有极其重要的意义。现有的有关隐私保护的研究集中于一般关系型数据、位置和轨迹信息、社交网络关系等数据类型的隐私保护,而社交媒体数据结构的复杂性使得隐私泄露的情况变得更加隐蔽,现有针对其他类型数据的隐私泄露的判定方式和隐私保护方法难于直接用于社交媒体用户行为的时间模式分析。为了发现社交媒体复杂时间数据中存在的潜在隐私泄露问题,给出针对网络论坛用户的行为时间模式的隐私泄露挖掘方法,设计并实现了多方法、多选择的聚类攻击者模型,实验通过攻击社交媒体用户的行为模式数据集,发现了用户行为时间模式的特异性和网络论坛中广泛存在着的用户隐私泄露的问题,应当引起充分重视。 相似文献
14.
针对汉越跨语言新闻话题发现任务中汉越平行语料稀缺,训练高质量的双语词嵌入较为困难,而且新闻文本一般较长导致双语词嵌入的方法难以很好地表征文本的问题,提出一种基于跨语言神经主题模型(CL-NTM)的汉越新闻话题发现方法,利用新闻的主题信息对新闻文本进行表征,将双语语义对齐转化为双语主题对齐任务。首先,针对汉语和越南语分别训练基于变分自编码器的神经主题模型,从而得到单语的主题抽象表征;然后,利用小规模的平行语料将双语主题映射到同一语义空间;最后,使用K-means方法对双语主题表征进行聚类,从而发现新闻事件簇的话题。实验结果表明,所提方法相较于面向中英文的隐狄利克雷分配主题改进模型(ICE-LDA)在Macro-F1值与主题一致性上分别提升了4个百分点与7个百分点,可见所提方法可有效提升新闻话题的聚类效果与话题可解释性。 相似文献
16.
时间敏感目标的打击能力主要是指对战场上稍纵即逝的目标实施快速打击的能力.时敏目标打击系统是一种战场指控模式的系统,是实现时间敏感目标打击的工具,而体系结构是设计时敏系统的一个基础蓝图.文中首先阐述了时间敏感目标打击系统的特点及能力,其次介绍了体系结构发展历史,最后设计了美军在时敏目标打击系统的体系结构方向研究动向,对时间敏感效能作战体系结构进行了探讨.该体系结构的设计对时间敏感目标打击系统的研究起到一定指导作用 相似文献
17.
传统的社团发现算法利用链接关系对社团进行划分,不利于发现社团之间的非链接关系,从而影响划分精度。研究分析了节点蕴含的文本信息,挖掘了文本信息蕴含了节点的主题信息,根据这些主题信息判断社团在主题上的关系。研究设计了优化的潜在狄利克雷分配模型对社团进行主题划分,应用优化的模块度社团发现算法对社团进行链接划分,合并成为一个能对社团进行主题划分和链接划分的主题社团发现算法。此外,还针对主题社团设计了一种评估方法,并且使用多个数据集在主题社团发现的各个阶段对算法进行了实验验证。实验结果证明,基于主题检测的社团发现算法能够正确地对社团进行主题划分和链接划分。 相似文献
18.
19.
城市功能区识别对于城市规划和管理具有重要的支撑作用,目前大部分研究主要依赖于影像和兴趣点(POI)分布数据进行识别,但多将区域内不同出行行为的人群混杂在一起,没有考虑不同群体对区域产生的不同影响。结合物以类聚、人以群分的思想构建城市功能区识别模型UFAI,通过学习不同功能区人群出行活动的特征识别相应功能区。基于大样本粗粒度的匿名轨迹数据,刻画并提取个体出行特征,依据个体的出行特征划分人群类型。在此基础上,构建并训练多任务深度学习模型,实现城市功能区识别。选取北京市2 000万匿名用户10个月的手机信令数据作为人群出行轨迹数据,使用UFAI模型进行计算,并与决策树、随机森林、集成学习梯度提升决策树等7种传统分类模型进行对比。实验结果表明,UFAI模型的F1值达到0.95,与对比模型相比提升了0.10~0.29,具有更好的识别性能。 相似文献