排序方式: 共有37条查询结果,搜索用时 15 毫秒
1.
2.
时序网络中的社区搜索问题旨在寻找符合一定时序规律的社区.短时交互特性作为时序网络的一种重要时序特征,相比于长期社区更具研究价值,可用于有效挖掘网络中核心的时序紧密结构.现有工作大多研究了时序社区的持续性、突变性、周期性等现象,尚无法建模时序社区的短时特性.针对现有工作难以满足上述需求的现状,提出top-k短时社区搜索这一新问题,为有效发现复杂网络中短时紧密社区提供新的解决思路.首先,针对时序网络中社区的短时特性,提出了δ-短时社区的形式化定义用以刻画短时社区结构.同时,给出了不同时间交互下形成的时序社区的时间跨度计算方式,为衡量短时社区提供一个具体的量化指标.其次,提出了top-kδ-短时社区搜索算法ShrimeCS,分析并讨论了短时社区的判断条件分别用以判断最小δ-短时社区和top-kδ-短时社区,并提出了δ-基本块结构结合判断条件用以找到最小δ-短时社区.此外,进一步提出了强δ-基本块结构以避免在扩展过程中出现子图冗余,从而降低搜索过程的时间开销.还分析了top-kδ-短时社区搜索过程中基于全局时间跨度上界与渐进时间跨度上界优化的启发式计算方法,以进一步加快算法运行效率,搜索优化率相比原算法提高64.2%以上.然后,在5个真实数据集和3个合成数据集上进行了实验,并提出了聚集因子指标用以评估时序社区中成员交互时间的接近程度.实验结果显示,ShrimeCS找到社区的短时性优于基准方法,基于全局时间跨度和渐进时间跨度上界优化可以降低17.16%以上的时间开销.在真实场景中的案例研究表明,ShrimeCS找到的top-kδ-短时社区可以捕捉到社区中时间跨度的变化,可以用来探索社区随时间的演化情况.最后,验证了所提方法的正确性,并表明ShrimeCS算法具有较好的可扩展性. 相似文献
3.
在传感器网络中,考虑到节点的通信开销在节点总能量开销中的比重大,以及用户由粗到细分辨率的不同查询需求,有必要在传感器网络中建立支持多分辨率的数据存储机制.首先提出了一种支持多分辨率的数据压缩存储策略 MDCS,节点基于 MDCS在网内产生多分辨率的近似结果;其次,给出了一种基于 MDCS的区域查询处理方法,根据用户给定的分辨率阈值去网内作区域查询处理,并将结果返回给用户.模拟实验表明,基于 MDCS的区域查询处理方法能够高效、低能耗地支持多分辨率的区域查询操作. 相似文献
4.
一种基于随机游走模型的多标签分类算法 总被引:5,自引:0,他引:5
在数据挖掘领域,传统的单分类和多分类问题已经得到了广泛的研究.但是多标签数据的普遍存在性和重要性直到近些年来才逐渐得到人们的关注.在多标签分类问题中,由于标签相关性的存在,传统的单分类和多分类问题的解决方法,无法简单地应用于多标签分类问题.文中提出了一种基于随机游走模型的多标签分类算法,称为多标签随机游走算法.首先,将多标签数据映射成为多标签随机游走图.当输入一个未分类数据时,建立一个多标签随机游走图系列.而后,对图系列中的每个图应用随机游走模型,得到遍历每个顶点的概率分布,并将这个点概率分布转化成每个标签的概率分布.最后,基于多标签随机游走算法,文中给出了一种新的阈值学习算法.真实数据集上的实验表明,多标签随机游走算法可以有效地解决多标签分类问题. 相似文献
5.
6.
7.
8.
9.
10.
海量文本数据近似复制文本检测在现实生活中具有广泛应用,如相似网页检测.提出了一种基于MapReduce的相似文本匹配算法,给定一个文本集合和相似性阈值,该算法能够有效计算文本集合中不小于该阈值的所有文本对.在真实数据集合上的实验结果表明,与现有工作相比,所提算法能够快速返回相似文本对. 相似文献