排序方式: 共有3条查询结果,搜索用时 93 毫秒
1
1.
在线社交网络文本流中的热点短语能反映文本流中隐含的热点话题和突发事件。本文提出了一种无需分词并能支持多种热度度量函数的热点短语挖掘技术。首先用文本流的某个典型时段采样得到候选短语,构建AC-Trie前缀树。然后,基于该前缀树,单遍扫描后续的文本流,将候选短语的历史出现频率记录在Trie相应节点上,从而支持多种基于历史频率的热度计算方法。此外,为及时发现新的热点短语并减少AC-Trie的构建次数,本文通过分析Trie树各节点上的遗漏短语频率,动态确定候选短语的更新时机。新浪微博数据集上的实验验证了本文方法的有效性(准确率达89%)和高效性(时空开销仅为基准算法的2%)。 相似文献
2.
3.
针对发布订阅系统中的拒绝服务攻击,提出一种有效的订阅合并方法。不同于现有订阅合并方法,该方法要求合并的订阅具有一定的相似性,因而可以减少合并后事件转发带宽开销。订阅相似性判断根据它在每个属性上约束范围的大小和位置,采用两阶段的归组算法把相似订阅归组,把处于同一组的订阅合并。理论分析表明,该方法时间复杂度低,可以根据节点负载情况动态控制合并粒度,因而可以有效解决拒绝服务攻击的问题。实验结果表明,该方法只增加少量的事件转发带宽开销。 相似文献
1